Визуальная библиотека

Тексты литературных шедевров интересны не только для чтения. Они могут быть объектами изучения — помогать ответить на вопросы:

  • Как автору удается создать захватывающую историю?
  • Какие слова, формы и сочетания используются?
  • В чем особенности стиля разных авторов? И другие.

Для этого нужно уметь «разглядывать» текст, вчитываться, замечать детали. Удобный способ развития такого умения — облако ключевых слов, где размер слов зависит от частоты их употребления. Визуализация семантического ядра текста удобнее таблиц — один взгляд охватывает весь текст, можно увидеть и главное (самые частые слова) и детали, незаметные ранее. Особенно удобно сравнивать по частоте разные слова и разные произведения.

Кроме этого, визуальная библиотека способна освежить в памяти прочитанные шедевры. «Трейлер» полного текста книги запустит цепочку воспоминаний, ассоциаций, сюжетов и образов.

Облака создаются с помощью сервиса wordclouds.com. В процессе визуализации исключаются стоп-слова (предлоги, частицы и союзы), слова да/нет/не/ни, очень, самый, все, тут, здесь, опять, снова, т.к. они преобладают во всех произведениях и не несут смысловой нагрузки. Во всех исследованных текстах по частоте во много раз преобладают местоимения он, я, она, они и др. и формы глагола быть, поэтому для фокусировки внимания на специфике каждого из текстов эти слова также исключены из визуализации. Разные формы ключевого слова объединяются в одну (например, говорить / говорил / говорили / проговорилась / отговорили и т.д.). Однокоренные слова разных частей речи объединяются в случае сходства их значений и очевидного преобладания одного из них (например, ответ837 + отвечала, 73 + ответный, 6 + ответов, 56 + отвечающий, 8 = ответ, 980).


Война и мир (Л. Толстой)

Показаны слова с частотой от 150 и более. По частоте упоминания героев (даже не читая роман) видим, вокруг кого строится история — Пьер, Андрей, Наташа, затем Марья, затем Наполеон и Кутузов и еще реже Денисов и Николай.

Большая частота употребления слов лицо, глаза, улыбка, голос, взгляд, рука, голова говорит о психологизме романа.

Сказать, говорить преобладает над слышать и видеть, смотреть; рациональное преобладает над чувственным (герои думают, делают и знают чаще, чем чувствуют и любят); описанию любви (любить) и дружбы (друг) в романе уделяется одинаковое внимание. Частотны лексемы война, войска, офицер, солдат, генерал, армия, сражение, однако дом, душа, Бог, радость, улыбка и человек — чаще, то есть в лексическом плане в романе мира больше, чем войны.

ВиМ

Скачать в хорошем качестве.


Посторонний (А. Камю)

Показаны слова с частотой 10+. Сказать встречается в повести 222 раза, частота слов ответ, спросить, говорить показывает фокусировку сюжета на диалогах. Главный герой много движется, ходит (слово идти и его формы — второе по частоте). Раймон и Мари — другие главные герои.

Слова суд, прокурор, тюрьма, адвокат «сужают» историю. Частое употребление концептов день, солнце, случай, мама, чувство, жить помогает раскрыть героя и описанное автором.

Руки, лицо, голова довольно частотны (аналогично другим произведениям). Но интересна частота слова «глаза»: оно упоминается гораздо реже, чем во всех других текстах. Возможно, так автор создает ощущение скрытности героя, т.к. человек, чувствуя вину и стыд, прячет глаза и избегает прямого взгляда.

 

камю

Скачать в хорошем качестве.


Мастер и Маргарита (М. Булгаков)

Облако слов с частотой 30+. Неожиданной оказалась частота упоминания героев — Маргарита (620); далее (по уменьшению частоты) — Иван, Воланд, Коровьев, Пилат, Иванович и только потом — Мастер (164).

Второе заметное отличие — частота слов сказать, говорить, спросить, отвечать примерно одинакова. В других текстах глагол сказать и его формы используется намного чаще остальных.

Третье отличие — автор уделяет большое внимание деталям облика и поведения человека: рука (4-е по частоте слово — 363 употребления), глаза (339), голова, лицо, голос, пальцы, нога, улыбка, ухо, сердце, грудь, плечи и др.

Необычно часты (в сравнении с другими текстами) слова кричать, черный (в 2 раза чаще, чем белый), кот, луна — они создают неповторимую мистическую атмосферу, а город, квартира, комната, дверь, окно делают её реалистичной, практически осязаемой.

мастер

Скачать в хорошем качестве.


Темные аллеи (И. Бунин)

Облако сборника рассказов И.А. Бунина похоже на «Мастера и Маргариту» —высока частота слов «идти» и «сказать«, «говорить«.

Вновь наблюдаем большое внимание к деталям внешности (глаза, руки, голова, волосы, губы, плечи, лицо, грудь, нога, тело) и описанию пространства, ограниченного домом / квартирой (дом, комната, дверь, окно, диван, балкон).

Особенности — низкая частота имен героев (местоимения исключены, но из них самое частое — «она«). Текст сборника необычно «раскрашен темными тонами» — частотны цвета и оттенки (черный, белый, блеск, темный, темнота, золотой).

бунин с лавкой+

Скачать в высоком разрешении.


Защита Лужина (В. Набоков)

Первое, что бросается в глаза — большое преобладание по частоте в романе имени главного героя Лужин (746 раз, следующее по частоте слово «сказать» — 340). Это может свидетельствовать о том, что основное внимание автор уделил «прорисовке» центрального персонажа. Известно, что прототипом гениального шахматиста, покончившего жизнь самоубийством, послужил друг Набокова Курт фон Барделебен.

Слово «сказать» и его формы максимально частотны — здесь мы видим аналогию с другими гениальным романами (кроме «Темных аллей» Бунина, где слово «идти» более частотно по сравнению с «говорить» и «сказать«). Кстати, слово идти используется реже, чем например, слово сидеть (во всех других произведениях слово сидеть гораздо менее частотно).

Частое употребление слов шахматы, шахматный, ход, фигура, доска позволяет автору создать атмосферу жизни шахматиста, которая постепенно сужается и превращается для него в шахматную игру.

Детали в характеристике героя (героев) по частоте и, следовательно, важности выстраиваются следующим образом — рука, глаза, лицо, голова, голос. Представим себя художниками и наверняка именно в этом порядке мы рисовали бы шахматиста — в первую очередь видели и рисовали бы руки, которыми он передвигает шахматные фигуры на доске.

Сравнение некоторых деталей позволяет нам лучше понять, расшифровать центральный образ. Например, отношения с отцом важнее отношений с матерью (слово отец используется в 2 раза чаще слова мать). Знать и думать — гораздо чаще, чем чувствовать и хотеть; слово жена используется в три раза чаще, чем муж. Роман «раскрашен» в черно-белые тона: черный (60) употребляется чаще, чем белый (50), другие цвета крайне редки — (11) розовый, (5) серый, (4) зеленый, (3) золотой, (3) синий,

Защита Лужина визуальная библиотека

Скачать в хорошем качестве


Лолита (В. Набоков)

Первое место по частоте — Лолита (381), слово Гумберт (119) используется почти в 4 раза реже.

Тексты Набокова оказались самыми «анатомически» подробными из всех, проанализированных мной, — такой детализации внешнего облика персонажей не встретилось еще нигде.

Нарисуем портрет героя / героини романа «Лолиты» Набокова, добавляя каждую деталь в порядке важности для автора: рука — глаза — нога (!) и только потом лицо — голова — волосы — губы — голос — колени — тело — улыбка — рот — пальцы — спина — грудь — кожа — зубы — ладонь — кисть — ресницы — плечо — рост — шея — смех — лоб — ногти — брови — локоть — ляжки — кудри — живот — кулак.

Если бы вы были Владимиром Набоковыми, то смотрели бы на людей (в том числе, на женщин) именно в таком порядке. Например, на руки, глаза и ноги обращали бы внимание чаще, чем на ресницы, брови и ногти. И кстати, ум в этой «иерархии внимания» далеко не самый важный — находится между улыбкой и пальцами.

Вторая группа слов, необычно частотных по сравнению с другими произведениями, — обозначения временивремя, день, жизнь, год, лет и другие.

По частоте выделяется слово девочка (160).

По сравнению с «Защитой Лужина» «Лолита» раскрашена более многоцветно: черный, белый, красный, розовый, золотой, серебряный, серый, голубой.

Лолита В. Набоков Визуальная библиотека

Скачать в высоком разрешении


1984 (Дж. Оруэлл)

Действующие лица по частоте упоминаний: Уинстон (631), О’Брайен (156), Джулия (127). Хронотоп: самые частые указатели пространства — «комната» (82), «место» (81), «Океания» (57) и времени — «время» (261), «день» (107) и «лет» (107).

Частотность слов «сказать» (246) и «рука» (161) совпадает с общей тенденцией «1000 самых частотных слов художественной литературы» («голова» (91) — реже общего).

Необычно частотны слова «партия» (263) + «партийный» (37), власть (59), министерство (58); к ним можно добавить новоязовские «телекран» (98), «пролы» (44), «двоемыслие» (22), «ангсоц» (18). В десятке самых частотных слов «знать» (199) и «книга» (176), большое количество и суммарная частота слов семантики мышления (думать, понимать, ум и др.), а также преобладание «правды» (52) над «ложью» (24). Это все создает неповторимый политико-психологически-детективный «привкус» романа.

Странно было думать, что небо у всех то же самое. И люди под небом те же самые — всюду, по всему свету, сотни, тысячи миллионов таких же людей; они не ведают о существовании друг друга, они разделены стенами ненависти и лжи и все же почти одинаковы.

1984 Частотность слов Оруэлл

Скачать в высоком качестве

Продолжение следует…

2 comments

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s