Заседание семинара по социофизике
к. ф.-м.н., доц. С.Н.Кольцов (НИУ ВШЭ, Санкт-Петербургская школа
социальных и гуманитарных наук, лаб. интернет-исследований, С.-Петербург)
Восстановление плотности многомерных распределений
в виде смеси распределений на основе тематического моделирования
Аннотация доклада
В связи с бурным развитием вычислительной техники наблюдается резкий рост работ в области методов статистического моделирования, в особенности в моделях с применением марковских цепей (МСМС-моделирование). Байесовский подход к оценке скрытых параметров многомерных распределений де-факто стал одним из ведущих методов в таких направлениях, как физика высоких энергий, масс-спектрометрия и биоинформатика, астрофизика, статистическая физика и социология. Одним из наиболее распространенных алгоритмов оценки скрытых параметров на основе наблюдаемых данных является алгоритм сэмплирования по Гиббсу. Алгоритм примечателен тем, что для него не требуется явно выраженное совместное распределение, а нужны лишь одномерные условные вероятности, входящие в распределение. В рамках доклада предполагается обсуждение проблемы (проблема стабильности и проблема выбора числа тем) восстановления исходного многомерного неравновесного распределения в виде смеси распределений со скрытыми параметрами на основе подхода ‘тематическое моделирование’. Также будут представлены социологические примеры применения тематического моделирования.