Визуальная библиотека

Тексты литературных шедевров интересны не только для чтения. Они могут быть объектами изучения — помогать ответить на вопросы:

  • Как автору удается создать захватывающую историю?
  • Какие слова, формы и сочетания используются?
  • В чем особенности стиля разных авторов? И другие.

Для этого нужно уметь «разглядывать» текст, вчитываться, замечать детали. Удобный способ развития такого умения — облако ключевых слов, где размер слов зависит от частоты их употребления. Визуализация семантического ядра текста удобнее таблиц — один взгляд охватывает весь текст, можно увидеть и главное (самые частые слова) и детали, незаметные ранее. Особенно удобно сравнивать по частоте разные слова и разные произведения.

Кроме этого, визуальная библиотека способна освежить в памяти прочитанные шедевры. «Трейлер» полного текста книги запустит цепочку воспоминаний, ассоциаций, сюжетов и образов.

Облака создаются с помощью сервиса wordclouds.com. В процессе визуализации исключаются стоп-слова (предлоги, частицы и союзы), слова да/нет/не/ни, очень, самый, все, тут, здесь, опять, снова, т.к. они преобладают во всех произведениях и не несут смысловой нагрузки. Во всех исследованных текстах по частоте во много раз преобладают местоимения он, я, она, они и др. и формы глагола быть, поэтому для фокусировки внимания на специфике каждого из текстов эти слова также исключены из визуализации. Разные формы ключевого слова объединяются в одну (например, говорить / говорил / говорили / проговорилась / отговорили и т.д.). Однокоренные слова разных частей речи объединяются в случае сходства их значений и очевидного преобладания одного из них (например, ответ837 + отвечала, 73 + ответный, 6 + ответов, 56 + отвечающий, 8 = ответ, 980).

«Война и мир»

Показаны слова с частотой от 150 и более. По частоте упоминания героев (даже не читая роман) видим, вокруг кого строится история — Пьер, Андрей, Наташа, затем Марья, затем Наполеон и Кутузов и еще реже Денисов и Николай.

Большая частота употребления слов лицо, глаза, улыбка, голос, взгляд, рука, голова говорит о психологизме романа.

Сказать, говорить преобладает над слышать и видеть, смотреть; рациональное преобладает над чувственным (герои думают, делают и знают чаще, чем чувствуют и любят); описанию любви (любить) и дружбы (друг) в романе уделяется одинаковое внимание. Частотны лексемы война, войска, офицер, солдат, генерал, армия, сражение, однако дом, душа, Бог, радость, улыбка и человек — чаще, то есть в лексическом плане в романе мира больше, чем войны.

ВиМ

Скачать в хорошем качестве.

«Посторонний»

Показаны слова с частотой 10+. Сказать встречается в повести 222 раза, частота слов ответ, спросить, говорить показывает фокусировку сюжета на диалогах. Главный герой много движется, ходит (слово идти и его формы — второе по частоте). Раймон и Мари — другие главные герои.

Слова суд, прокурор, тюрьма, адвокат «сужают» историю. Частое употребление концептов день, солнце, случай, мама, чувство, жить помогает раскрыть героя и описанное автором.

 

камю

Скачать в хорошем качестве.

«Мастер и Маргарита»

Облако слов с частотой 30+. Неожиданной оказалась частота упоминания героев — Маргарита (620); далее (по уменьшению частоты) — Иван, Воланд, Коровьев, Пилат, Иванович и только потом — Мастер (164).

Второе заметное отличие — частота слов сказать, говорить, спросить, отвечать примерно одинакова. В других текстах глагол сказать и его формы используется намного чаще остальных.

Третье отличие — автор уделяет большое внимание деталям облика и поведения человека: рука (4-е по частоте слово — 363 употребления), глаза (339), голова, лицо, голос, пальцы, нога, улыбка, ухо, сердце, грудь, плечи и др.

Необычно часты (в сравнении с другими текстами) слова кричать, черный (в 2 раза чаще, чем белый), кот, луна — они создают неповторимую мистическую атмосферу, а город, квартира, комната, дверь, окно делают её реалистичной, практически осязаемой.

мастер

Скачать в хорошем качестве.

«Темные аллеи»

Облако сборника рассказов И.А. Бунина похоже на «Мастера и Маргариту» —высока частота слов «идти» и «сказать«, «говорить«. Вновь наблюдаем большое внимание к деталям внешности (глаза, руки, голова, волосы, губы, плечи, лицо, грудь, нога, тело) и описанию пространства, ограниченного домом / квартирой (дом, комната, дверь, окно, диван, балкон). Особенности — низкая частота имен героев (местоимения исключены, но из них самое частое — «она«). Текст сборника необычно «раскрашен темными тонами» — частотны цвета и оттенки (черный, белый, блеск, темный, темнота, золотой).

бунин с лавкой+

Скачать в высоком разрешении.

Продолжение следует…

2 comments

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s