Сообщения

Сообщения за апрель, 2025

Практическое задание №8. Network-анализ

Изображение
Я вз яла файл данных о прослушивании альбомов. Network Explorer Correlations MDS 1) Наиболее значимые связи наблюдаются между роком и инди. Преобладающий тип контента — "другие". 2) Рок является центральным элементом, обозначенным ярким зеленым кругом. 3) Для меня наиболее удобным инструментом является Network Explorer. Визуально комфортно анализировать данные по цветовым областям и количеству связей. В Correlations слишком много информации, а в MDS данные сильно переплетаются, хотя этот компонент тоже достаточно прост для восприятия.

Практическое задание №7. Графический анализ c кластеризацией и алгоритмом t-SNE

Изображение
  Для анализа я выбрала 10 различных постеров в эстетике 60-ых годов Америки.  1) Результаты различаются. Кластеризация и Image Grid группировали изображения на основе наличия схожих элементов, таких как повторяющиеся линии, фигуры и соотношение между изображением и текстом. В то время как t-SNE в большей степени ориентировался на цветовые характеристики. На мой взгляд, наиболее точное разделение изображений было достигнуто с помощью модели Hierarchical Clustering. 2)  Для анализа я выбрала 10 ретро постеров в эстетике 60-ых годов Америки и идеи "Американской мечты". Часть из них сгруппировалась из-за доминирования схожих цветов, другая из-за общности некоторых элементов (крупной надписи, повторяющихся линий). Отчасти я согласна с логикой разделения, но несколько картинок точно поменяла бы местами. 

Практическое задание №6. Графический анализ

Изображение
 Для анализа я выбрала 10 различных постеров в эстетике 60-ых годов Америки.  1) Вторая модель показалась мне наиболее точной, поскольку она обеспечила более ясное разделение постеров на группы. Кроме того, по этой модели легче определить признаки, по которым изображения были сгруппированы, так как они явно видны и их можно сравнить. 2)  Для анализа я выбрала 10 ретро постеров в эстетике 60-ых годов Америки и идеи "Американской мечты". Часть из них сгруппировалась из-за доминирования схожих цветов, другая из-за общности некоторых элементов (крупной надписи, повторяющихся линий). Отчасти я согласна с логикой разделения, но несколько картинок точно поменяла бы местами. 

Практическое задание №5. Автоматизированный кластерный анализ

Изображение
  1.  Для анализа я выбрала 10 текстов песен группы "Порез на собаке".  2. Тексты разделились на 4 группы. В первой группе оказалась песня "Половина", это единственная песня повествующая о внутреннем мире и переживаниях автора, его как лирического героя. Вторая группа объединила в себе две песни: "Мандраж" и "Внутри-снаружи", две эти песни повествуют о женщинах, про которых рассказывает лирический герой, об их мрачной судьбе и тяжелой жизни. В третьей группе оказалась песня "Выход", единственная сатирическая песня во всем списке. Последняя же группа объединила в себе песни с уклоном в "сказочность" и "фольклорность".  3. Число групп меняется при изменении уровня кластеризации. При смещении разделителя вправо - увеличивается, при смещении влево - уменьшается.

Практическое задание №4. Автоматизированный контент-анализ с моделью текста

Изображение
 Для анализа я взяла для аналитические статьи по сериалу "Ганнибал" от разных авторов и с разным эмоциональным посылом.  1 статья: 2 статья: Вывод: Мы рассмотрели результаты обоих документов и можем заключить, что облако слов предоставляет гораздо больше информации и конкретики по сравнению с выделением определенных тем в тексте. С помощью первого метода мы можем понять, о чем речь в данных текстах и что они содержат. Второй метод же позволяет лишь выявить общую тему, касающуюся сериала. Тем не менее, в облаке слов чаще всего выделяются предлоги, что не всегда отражает суть текста. Этот инструмент можно использовать, но важно самостоятельно анализировать полученные данные.

Практическое задание №2. Структурный sentiment анализ информации с моделями MDS, ACM и оценкой дисперсии

Изображение
Для проведения анализа я выбрала два текста одной направленности, но слегка разной эмоциональной окраски. Это тексты песен группы "Пасош". Первая - со слегка меланхоличными и ностальгирующими мотивами, когда же вторая - с грустным и тяжелым посылом.  1. 2. Вывод: второй текст действительно считывается более печальным и гораздо более эмоциональным, нежели чем первый. Наиболее точную оценку, на мой взгляд, даёт модель MDS.

Практическое задание №3. Sentiment Analysis в социальных медиа

Изображение
 1. Adidas Соотношение позитивных упоминаний к негативным равняется 7:3. Преобладают позитивные и нейтральные упоминания. Преобладает фотоконтент (60%), после него идет видеоконтент (34%). По ключевым словам можно понять, что больше всего пользователей интересует взаимодействие бренда со спортивными институциями. 2. Asics Соотношение позитивных упоминаний к негативным равняется 9:1. Преобладают позитивные и нейтральные упоминания. Преобладает фотоконтент (43%), после него идет видеоконтент (27%), до видеоконтента буквально один процент не дотягивают ссылки (26%). По ключевым словам можно понять, что больше всего пользователей интересует обувная продукция компании.  3. Demix Соотношение позитивных упоминаний к негативным равняется 4:1. Преобладают позитивные и нейтральные упоминания. Преобладает фотоконтент (55%), после него идут ссылки (35%). По ключевым словам можно понять, что больше всего пользователей интересует обувная продукция компании, ее приобретение и активный отдых....
Изображение
 Практическое задание №9. Для анализа выбраны данные о въезде и выезде туристов. Наиболее точным для анализа модель является, по моему мнению, scater plot. По ней удобно отслеживать необходимые данные. Остальные модели чуть менее понятны, но не менее полезны.