Как работает корпус?

В поисковое окно вводится слово, часть слова с точкой или с точкой и звездочкой. Грамматический поиск позволяет найти любую форму лексемы (слова, рассматриваемого как абстрактная словарная единица) или произвольную комбинацию грамматических признаков.

Например, в окно "поиск словоформы" можно ввести запрос:

  • pociągiem - будет найдена только заданная форма существительного pociąg.
  • pociągiem z – будут найдены также выражения pociągiem z Moskwy, pociągiem z Frankfurtu.
  • pocią.* (любое количество знаков) - будут найдены pociąg, pociągiem, pociągnęła, pociąć.
  • pocią. (один знак) - будут найдены pociąg, pociąć, но не: pociągiem, pociągnęła.

Можно также искать русские и польские слова одновременно, напр., предложения со словом kolega в польской части и со словом друг в русской части.

В окно лексико-грамматического поиска вводим основную (словарную) форму лексемы: koło – будут найдены все формы этого существительного, такие как koło, kołem, kole, kołach.

В соответствующем окне мы можем также определить интересующие нас грамматические признаки и найти, напр., любое существительное среднего рода в предложном падеже множественного числа. В этом случае поисковая система выдаст такие результаты, как kołach, oknach, dzieciach.

Омонимия снята с грамматических форм в корпусе только частично, то есть при поиске формы лексемы dama мы должны получить dam в контексте wielkich dam i kawalerów, но не в контексте ja ci dam. В польском тексте омонимия снята полностью, хотя встречаются ошибки, в русском тексте - только в незначительной части, поэтому в русских текстах дам будет показано в тех же контекстах в ответ на запрос, касающийся лексемы дама и дать.

В поисковую систему корпуса вводятся слова или словосочетания, а результаты поиска представляют собой пары предложений из текстов оригиналов и их переводов, содержащие искомые выражения. Естественно, в переводе предложению, в котором употреблены слова pociąg или mama не обязательно соответствует предложение с русскими эквивалентами данных выражений. Может случиться и так, что предложение оригинального текста вообще не имеет пары в тексте перевода, так как переводчик мог объединить два или несколько предложений в одно, разбить при переводе предложение оригинала на несколько или вообще опустить какую-либо информацию. В таких случаях в результате поиска мы получим предложение, которому соответствует целый абзац текста перевода, далеко не всегда содержащий идентичную с оригиналом информацию. Подобные несоответствия могут появиться также в результате ошибок программы, выравнивающей тексты, которые мы стараемся по мере возможности исправлять.