Вт. Мар 19th, 2024

Теория анализа

Центральной задачей топологической теории сентимент-анализа является разработка алгоритмов классификации текстов, позволяющих отличать (с максимально возможной специфичностью и селективностью) тексты заданного класса («безрезультатные», «манипулятивные», «негативные коннотации» и др., см. ниже) от всех остальных текстов. Системы машинного обучения оперируют с множествами прецедентов, представляющих собой материал обучения таких алгоритмов. Отдельный прецедент или объект (отдельное предложение, абстракт или полный научной публикации) состоит из признакового описания (то есть слов и словосочетаний текста) и информации о принадлежности этого объекта к тому или иному классу объектов (например, класс К1 – «манипулятивные тексты», класс К2 − «нормальные тексты» и др.). Такие классы принадлежности объектов (текстов), естественно, задаются экспертом. При поиске “фейков” признаками являются соответствующие конструкции языка или «сентименты» (так как подразумевается исследование эмоционально нагруженных языковых конструкций). Было изучено 16 классов текстов и построены соответствующие алгоритмы для распознавания этих классов.