В разных языках прилагательные, которые в словарях соотносятся как переводные эквиваленты, могут иметь разные поля употреблений. То есть, они имеют не полностью идентичную семантику, что часто становится проблемой при переводе для людей, не в совершенстве владеющих иностранным языком. Эта проблема относится к ряду вопросов, которые изучает область лингвистики, называемая лексико-семантической типологией.
Лингвистические теории о языке как показателе культуры народа-носителя подтверждают факт того, что переводные эквиваленты не всегда имеют абсолютно идентичные значения. Через изучение подобных различий в значениях тех слов, которые на первый взгляд кажутся совершенно точными переводами друг друга, можно понять больше о культуре народа и страны, а также об языковой картине мира носителей языка.
Дальнейшая разработка этой темы касается кластеризации существительных, для которых установлена сочетаемость с прилагательными заданного ряда в биграммах. При кластеризации в первую очередь учитывается эта сочетаемость. Кластеризация будет произведена тремя разными подходами: включающими и не включающими дополнительный этап разбиения на кластеры, основанный на семантических значениях.
Существуют различные способы классификации лексики, как правило, основанные на семантике. Способ, который будет представлен в этой работе, основан на сочетаемости единиц лексики. Семантический аспект будет иметь меньшее влияние на процесс кластеризации. В конце такой подход будет проанализирован с точки зрения того, насколько точно полученные кластеры связаны семантически.