Аннотации:
Дипломная работа посвящена решению задачи подбора публикаций для интернет-сообществ в социальных сетях. Актуальность работы растет с ростом социальных сетей и интересом для анализа, в частности, для целей маркетинга.
Первый раздел посвящен постановке задаче и анализу способа решения задачи. Формулируются гипотезы о способах оценки записей с промежуточными этапами. Из этих гипотез строится задача оценки, основанная на предположении о силе пользователя, силе тематике для сообщества, и динамике роста популярности записи на ранних этапах жизни.
Во втором разделе производится анализа предметной области и существующих методов: оценки влиятельности и моделей распространения.
В разделе, посвященном реализации, задача преобразуется в модельную, которая использует базу данных наполненную срезом записей социальной сети Twitter. Модельная задача отличается и тем, что на входе не данные о сообществе, а тема. Алгоритм должен сам получить необходимую информацию о сообществе и его структуре. Фиксируется временная точка, для прогнозирования используются данные до выбранного момента, для оценки – после него. Выводы строятся на основе результатов тестирования четырех примеров: для двух тематик и четырех временных точек. Приведенные в приложении отчеты достоверно иллюстрируют успешность разработанного алгоритма.
В заключении автор резюмирует обоснованность использования линейной модели для оценки будущей популярности. В качестве планов дальнейшего развития, предлагается перенос на реальную социальную сеть и уточнение информации о росте повторных публикаций записи до интервала в один час.
Результаты работы могут быть полезны в анализе социальных сетей, как инструмент маркетолога, работающего с интернет-сообществами.