Плагин-словарь начисто игнорирует слова в не кириллице. Значит ли это, что на ТОМ2 не удастся написать игру, например, на английском языке? Я понимаю, что он разрабатывается в первую очередь для русского языка с возможностями парсить такую сложную морфологию, но по идее ТОМ2 должен работать с любым языком. Падежи, роды и прочие морфологические признаки не зашиты в платформу, а описываются в стандартной библиотеке или непосредственно игрописателем. Так зачем же такие ограничения?
В TOM.dic словарные статьи содержат не одну основу, а несколько. Почему?
Например, для слова "ответ":
Зачем такие сложности? Значит ли это, что словарь будет выдавать эту статью не только на слово "ответ", но и на слова "отвеет" и "ответет"? И почему не будет.
И самый главный вопрос: как в таком случае прочитать заголовок словарной статьи. Сейчас я перебираю всю матрицу, по индексам восстанавливаю начала и окончания, по значению в ячейке нахожу смещение статьи (или списка статей) и получаю в этом месте такую подлость в виде нескольких основ. К какой основе присабачивать начало и окончание?
Я уже окончательно сдался менять словарь прямо в формате TOM.dic, но дайте мне хотя-бы прочитать его содержимое в виде списка словарных статей. Понимаю, что всё это сделано для скорости поиска и для экономии оперативной памяти (чтобы не хранить весь словарь в оперативной памяти), но то что я увидел, разбираясь с этим форматом... ох ладно, тебе виднее.
Отредактировано Alexandr (2014-01-08 18:24:19)