В большинстве литературных курсов на уровне колледжа вы обнаружите, что студенты анализируют небольшие порции литературной классики: монологи Шекспира, поток сознания Джойса и стаккато-предложения Хемингуэя. Без сомнения, благодаря такому внимательному прочтению можно многое узнать о писателе, его или ее ремесле и значении истории.
Но Бен Блатт приводит веский аргумент в пользу другого подхода. Сосредоточив внимание на определенных предложениях и абзацах, он помещает в своей новой книге «Любимое слово Набокова - лиловый», читатели пренебрегают всеми другими словами, которые в романе средней длины составляют десятки тысяч точек данных.
Журналист и статистик создали базу данных текста из небольшого количества классиков и бестселлеров 20-го века, чтобы количественно ответить на ряд вопросов, представляющих интерес. Его анализ выявил некоторые странные закономерности, которые в противном случае могли бы остаться незамеченными:
По номерам лучшие вступительные предложения к романам имеют тенденцию быть короткими. Хороший автор Джеймс Паттерсон имеет в среднем 160 клише на 100 000 слов (это на 115 больше, чем уважаемая Джейн Остин), а Владимир Набоков использовал слово mauve в 44 раза чаще, чем средний писатель за последние два столетия.
Smithsonian.com говорил с Блаттом о его методе, некоторых из его основных открытий и почему большие данные важны для изучения литературы.
Вы применили статистический подход к изучению всего: от « Где Уолдо» до « Сайнфельда», фаст-фудов и поп-песен. Можете ли вы объяснить свой метод и почему вы делаете то, что делаете?
Я журналист данных, и я смотрю на вещи в поп-культуре и искусстве. Мне действительно нравится смотреть на вещи количественно и беспристрастно, которые содержат много информации, через которую люди не прошли. Если бы вы хотели узнать, каков типичный человек из Соединенных Штатов, это было бы полезно, но вы не просто поговорили бы с одним человеком, узнали бы о нем все, а затем предположили бы, что все в людях в Соединенных Штатах так же. Я думаю, что одна вещь с написанием такого рода теряется, что вы можете сосредоточиться на одном предложении автора, особенно на уроках творческого письма, или на одном отрывке, и вы потеряете более широкую картину, чтобы увидеть эти общие закономерности и тенденции, которые используют писатели. снова и снова, сотни и, может быть, тысячи раз в своем собственном письме.
Любимое слово Набокова - лиловый: что показывают цифры о классике, бестселлерах и нашем собственном творчестве
купитьТак что же заставило вас обратиться к литературе?
Мой опыт в математике и информатике, но я всегда любил читать и писать. Поскольку я писал все больше и больше, мне стало очень интересно, как разные писатели и люди дают советы по написанию. Многое из этого имело смысл, но, казалось, не подкреплялось информацией, а многое противоречило друг другу. Я просто подумал, что должен быть способ взять эти темы в письменном виде, о которых люди уже хорошо знают и обсуждают, и протестировать их на великих авторах и популярных авторах, чтобы увидеть, является ли этот совет реальным или это предписывающий совет, который не ' на самом деле это ничего не значит в настоящих книгах и настоящих страницах.
Какой первый вопрос вы хотели задать о литературной классике и бестселлерах?
Первая глава в книге посвящена совету о том, следует ли использовать наречия - только. Это также первая глава, которую я написал в хронологическом порядке. Это в основном по совету Стивена Кинга не использовать только наречия в своей книге « О письме», которая для многих авторов является книгой о писательстве. Но многие другие писатели - Тони Моррисон, Чак Пэлэнюк - и любой творческий класс письма советуют не использовать только наречие, потому что это - ненужное слово и признак того, что вы не лаконичны. Вместо того чтобы сказать: «Он быстро побежал», вы можете сказать: «Он побежал».
Итак, я хотел знать, правда ли это на самом деле? Если это такой хороший совет, вы ожидаете, что великие авторы действительно используют его меньше. Вы ожидаете, что писатели-любители используют его больше, чем опубликованные авторы. Я просто очень хотел, стилистически узнать, сначала, последует ли Стивен Кинг своему собственному совету, а затем, применим ли он ко всем другим великим и уважаемым авторам.
Итак, что вы нашли?
На самом деле, существует тенденция, согласно которой такие авторы, как Хемингуэй, Моррисон и Стейнбек, их лучшие книги, те, которые сейчас держат в руках и привлекают к себе наибольшее внимание, - это книги с наименьшим количеством наречий-только. Кроме того, если вы сравните любительскую беллетристику и онлайн-тексты, которые не редактировались с бестселлерами и лауреатами Пулитцеровской премии в последнее время, есть несоответствие, когда опубликованные авторы используют менее наречие. Я не настолько односторонен, что думаю, что вы можете просто вынуть наречия из хорошей книги, и она станет великой книгой. Это явно не так, как это работает. Но есть кое-что в том факте, что писатели, которые пишут очень прямым образом, производят книги, которые в целом живут дольше всего.
Как вы занялись созданием базы литературных произведений?
Для многих вопросов я использовал те же 50 авторов, которых я выбрал несколько произвольно. По сути, это были основанные на авторах, которые были на вершине списка бестселлеров, авторов, которые были на вершине величайших авторов всех времен списка и авторов, которые просто отчасти представляли различные жанры и времена и читателей. Таким образом, на протяжении всей книги вы можете сравнить этих авторов и познакомиться с ними.
Для меня было очень важно, что если бы я сказал что-то вроде: «Тони Моррисон использует это слово с такой скоростью», я говорил о каждом отдельном романе, который она когда-либо писала, а не только о трех, которые у меня уже есть. В моей книге упоминается от 50 до 100 авторов. Я нашел их библиографии, а затем нашел все их романы, которые они написали до того момента, как их полную запись. В некотором смысле это похоже на ведение спортивной статистики, когда каждая книга напоминает сезон, а затем все эти сезоны или книги объединяются в одну карьеру. Вы можете увидеть, как авторы меняются со временем и как они все делают в целом. Если у вас есть все книги в архиве, то ответить на эти вопросы, которые в некотором смысле очень сложны, очень просто.
И как ты обработал весь этот текст?
Существует язык программирования, называемый Python, и в нем есть набор инструментов, называемых Natural Language Toolkit, часто сокращенно NLTK. Инструменты, участвующие в этом, свободно доступны для всех. Вы можете скачать пакет онлайн и использовать его на Python или других языках. Вы не можете получить много вопросов о письме, в частности, но вы можете сказать, сколько раз это слово появляется в тексте? Он может пройти и определить, где заканчиваются предложения и где начинаются предложения, а также части речи - прилагательное против наречий против глагола. Итак, когда у вас есть эти инструменты, вы можете получить данные.
Какую статистику вы составляли вручную? Что было самым утомительным?
Есть один раздел, где я смотрю на вводные предложения. Элмор Леонард, который был очень успешным романистом, сказал: «Никогда не открывайте книгу с погодой». Это также совет, который можно найти во многих руководствах по написанию. Поэтому я просмотрел сотни авторов, чтобы узнать, как часто они открывают свою книгу о погоде. Например, Даниэль Стил, я считаю, что 45 процентов ее первых предложений в книгах посвящены погоде. Много раз это просто «Это был великолепный день» или «Было светло и солнечно», и тому подобное. Для этого не было никакого способа сделать это автоматически без какой-либо ошибки, поэтому я просто просмотрел все файлы книг и отметил, была ли какая-то погода. Вы можете сказать, что это было утомительно, потому что было собрано много данных, но было забавно просматривать и читать сотни открывающих предложений одновременно. Существуют и другие закономерности, которые со временем появляются у авторов.
Как вы говорите, утомительно для одних, весело для других. Некоторые могут подумать, что этот аналитический подход скучен, но вы утверждаете, что он может быть «забавным» и «часто просто смешным». Каким был ваш самый смешной вывод?
Название книги «Любимое слово Набокова - лиловый» - о том, как по номерам слово, которое он использует с наибольшей скоростью по сравнению с английским, является лиловым. Это в конечном итоге имеет большой смысл, если вы посмотрите на его прошлое, потому что у него была синестезия. В своей автобиографии он говорил о том, что когда он слышит разные буквы и звуки, его мозг автоматически вызывает в воображении цвета.
Я повторил этот эксперимент на 100 других авторах, чтобы увидеть, какое их любимое слово. В результате вы получите три слова, которые представляют их написание по словам, которые они используют больше всего. Вежливость, фантазии и неосторожность. Это Джейн Остин. Думаю, если бы вы увидели эти слова, Джейн Остин могла бы стать одной из ваших первых догадок. И затем у вас есть такой автор, как Джон Апдайк, который немного более суров, реален и другого времени. Его любимые слова - оправлены, укол и траханье. Я думаю, что видеть личность, основанную на этих простых математических вопросах, очень интересно. Если у вас есть любимый автор, прохождение через него действительно что-то говорит об их личности, чего вы, возможно, раньше не замечали.
Рэй Брэдбери написал, что его любимое слово - корица. По номерам он часто этим пользуется. Его объяснение того, почему он любил корицу, состояло в том, что это напомнило ему о кладовой его бабушки. Поэтому я нашел и нашел другие слова со специями и запах, которые могут быть связаны с кладовой бабушки, и Рэй Брэдбери использует большинство этих слов с очень высокой скоростью. В некотором смысле, вы можете получить этот странный, фрейдистский взгляд на детство авторов. Если бы Рэй Брэдбери не сказал этого, возможно, ты все еще мог бы понять это.
Вы сравнили американских и британских писателей, подтверждая стереотип, что американцы громко говорят. Вы можете объяснить это?
Этот был фактически основан на исследовании, проведенном аспирантом в Стэнфорде. Он определил слова, которые используются для описания диалога в книгах, и назвал их громкими, нейтральными или тихими. «Шепот» и «бормотание» будут в тишине. Нейтральным будет «он сказал» или «она сказала», а громким будет «он воскликнул» или «кричал». Я просмотрел 50 авторов, на которых смотрел, а также большие образцы фанфиков и обнаружил, что сумасшедшим, но значимым, что американцы имеют более высокое отношение громких слов к тихим. Есть несколько объяснений. Возможно, именно так говорят американцы на протяжении всей своей жизни, поэтому авторы описывают, как они часто говорят. Вы могли бы также видеть, что американские писатели предпочитают более экшн-триллерные сюжеты с высокими темпами по сравнению с более тонкими. Американцы действительно громче по цифрам.
Бен Блатт, автор книги «Любимое слово Набокова - лиловый» (Сьерра-Катов)Как вы думаете, почему применение математики к письму является хорошим способом изучения литературы?
Я определенно не сторонник того, чтобы это был первый способ изучения литературы, если вы пытаетесь улучшить свое письмо. Но даже роман средней длины, вероятно, 50000 слов, и это 50000 точек данных. Вы просто не сможете понять это сразу, и будут некоторые вопросы, на которые вы просто не сможете ответить, прочитав сами. Приятно видеть картину в целом. Если вы сядете и изучите один абзац, вы будете в своем классе творческого письма разговаривать со своим профессором, если есть определенный способ взглянуть на это, вы просто увидите это во всем. Но с данными, это как бы освобождает вас, и вы можете ответить на некоторые вопросы без этих предубеждений и действительно получить некоторую новую информацию.
Вы упоминаете, что продолжали вспоминать «Великий грамматизатор» Роальда Даля.
Существует замечательная история Роальда Даля, где по сути инженер придумывает способ написать историю. В этом сценарии конца света кто-то может просто дать машине сюжет, и он выплюнет последний роман. Намек на то, что они производят романы, которые являются настолько формальными и основными. Главный герой в этой истории решает не присоединяться к работе машины и борется с ней, создавая свои собственные произведения и произведения искусства.
Я определенно думаю, что эта книга, если вы будете писать, ответит на множество вопросов для вас и определенно изменит ваш взгляд на некоторые вещи, но в конечном итоге на самом деле нет замены идеям, которые заставляют людей думать, и сценам, которые заставляют людей боязнь или связь с персонажами. Эта книга рассматривает искусство письма и не обязательно, как создать незабываемый рассказ. Эта книга не пытается создать идеальный роман, и я не думаю, что мы настолько близки к этому, как могут опасаться некоторые люди.