С момента рождения современных англоязычных романов в 1700-х годах мужские и женские персонажи от Пола Атрейдеса до Элизабет Беннет смеялись, улыбались, чувствовали и действовали на своих страницах. Новое исследование, проведенное с использованием алгоритма машинного обучения, дало свежий взгляд на их историю. «Трансформация гендера в англоязычной художественной литературе», опубликованная на этой неделе в журнале Cultural Analytics, проанализировала представление гендера в более чем 100 000 романов, обнаружив парадокс, когда дело дошло до романов 20-го века: как жесткие гендерные роли казалось, рассеивается, указывая на большее равенство между полами, число женских персонажей - и доля женщин-авторов - уменьшились.
Построенный автором исследования Тедом Андервудом, профессором английского языка и информационных наук в Университете Иллинойса, и его соавтором по информационным технологиям Дэвидом Бамманом из Калифорнийского университета в Беркли, алгоритм проанализировал персонажей и авторов 104 000 романов - гораздо больше, чем вы. прочитаю в жизни. Андервуд и Бэмман изначально разработали алгоритм для предыдущего исследования по характеристике: к текущему исследованию присоединилась соавтор Сабрина Ли, аспирант Университета Иллинойса. Романы были отобраны в основном из цифровой библиотеки HathiTrust и представляли собой подборку бестселлеров с 1703 по 2009 год. В список включены популярные издания, такие как Pride и Prejudice, Dune и некоторые из романов Раймонда Чандлера.
Посмотрев данные и разбив их по времени, исследователи смогли увидеть тенденции за определенные периоды: например, между 1800 и 1970-ми годами «устойчивое снижение» доли женщин-авторов - с примерно 50 процентов до менее чем 25 процентов. В тот же период они увидели снижение числа названных персонажей женщин. Эти тенденции начинают меняться во второй половине 20-го века. И в ходе их изучения произошли драматические и быстрые изменения в словах, используемых для характеристики пола, а также уменьшение количества специально гендерных слов.
Многие из этих слов не были явно гендерными, как «сердце» или «дом», хотя потенциально гендерные слова, такие как «юбка» или «усы», не были исключены. Например, в 1800-х годах глагол «чувствовал» больше ассоциировался с женщинами, а глагол «приобретал» чаще ассоциировался с мужчинами. Эти тенденции со временем уменьшились, пока к 1900-м годам другие слова не стали более заметно ассоциироваться с мужчинами и женщинами. В 1900-х годах слова, относящиеся к веселью, стали больше ассоциироваться с женщинами, и произошло соответствующее снижение употребления этих слов по отношению к мужчинам. «Женщины улыбаются и смеются, - пишут авторы, - но мужчины середины века, по-видимому, могут только улыбаться и смеяться». Точно так же в 19-м веке гораздо больше обсуждают чувства, вначале в основном в отношении женских персонажей. В 20-м веке гораздо больше о телах и одежде - например, мужчины середины века постоянно кладут вещи в карманы или вынимают их.
По словам Андервуда, именно такой результат демонстрирует необходимость подходов к машинному обучению: «На самом деле культура не имеет четких определений того, что такое пол или что такое литературный жанр», - говорит он. «А машинное обучение позволяет нам работать с нечеткими концепциями».
Этот метод чаще использовался для работы с банковскими данными или для обеспечения безопасности вождения автомобилей, поэтому он может показаться странным для анализа романа. Но Андервуд и другие ученые в области цифровых гуманитарных наук видят большой потенциал.
Сет Лонг, профессор английского языка в Университете штата Небраска, который также работает в области цифровых гуманитарных наук, говорит, что эти неожиданные результаты демонстрируют силу больших данных для гуманитарных наук. «Статистическое моделирование потребует совершенно другого подхода к пониманию истории литературы», - говорит он. Алгоритм - это чистый лист до получения информации, но, получив такую информацию, он может извлечь из нее то, чего не могут люди. В этом случае это прерывает научные предположения о том, как история литературы должна сочетаться с историей социального прогресса женщин.
«Когда вы видите [исследование] вместе с более традиционными литературно-историческими проектами, вы можете увидеть связи, которые вы, возможно, не видели бы иначе», - говорит Клэр Джарвис, профессор английского языка в Стэнфордском университете. Это подтверждает некоторые «догадки», которые она имела относительно пути литературы, в количественном отношении. Это включает в себя уменьшение доли женщин-авторов за весь исследуемый период, что удивило Андервуда.
«Я ожидал увидеть некоторый прогресс, просто с точки зрения равенства представительства женщин в художественной литературе», - говорит Андервуд. «Может быть, не много прогресса, но некоторый прогресс. И мы действительно ничего не видим ».
Первые романы, в которых использовался современный английский, рассматривались скорее как развлечение, а не как законное литературное начинание. Но «по мере того, как роман становится все более респектабельным, - говорит Джарвис, - он становится все менее связанным с женским авторством». Другими словами: мужчины начали писать романы, когда он начал выглядеть как «серьезное» занятие.
Хотя литературные историки говорили об уходе женщин из романа в определенные моменты раньше, говорит Андервуд, никто не занимался такой масштабной работой, которая продемонстрировала бы непрерывные тенденции. Вот тут-то и начинается машинное обучение.
Ли говорит: «Литературные ученые, мы очень хорошо знаем, что есть молчание», то есть места в истории литературы, где книги не были написаны. Еще одно молчание, которое она считает важным, - растущее отсутствие названных женских персонажей в изученных романах. Она является поклонницей романов псевдонимного итальянского автора Елены Ферранте и говорит, что характеристика женской дружбы в книгах Ферранте подчеркивает «молчание» женской дружбы в художественной литературе в другом месте, как из прошлого, так и из настоящего. Для нее исследование подчеркивает то же самое и подчеркивает «важность работ с женщинами, которые видят женщин». Отсутствие женщин в романе «незаметно повлияло на то, как мы относимся к литературной истории», говорит Андервуд.
Авторы отмечают, что их исследование не охватывает все романы, написанные в этот период времени, и отсутствует представление из жанровых художественных произведений, таких как романы и детективные романы, которые стали популярными в 20-м веке. Тем не менее, исследователи предприняли шаги, чтобы исправить их предвзятость, протестировав свою базу данных с другими базами данных. Книги, которые они выбрали, представляют собой литературу, которая считалась важной для академических библиотек, и авторы отмечают, что в жанровой фантастике предстоит еще много работы. «Литературный пол может быть сконструирован по-разному в разных жанрах или в разных частях литературного поля», - пишут авторы.
Методы машинного обучения предлагают новый способ взглянуть на тишину и присутствие прошлого - как ни странно, через призму предсказания. Как правило, алгоритмы используются для прогнозирования или выявления закономерностей на основе набора информации, но Лонг говорит, что их использование для истории заключается в том, что они могут обнаруживать долгосрочные тенденции в прошлом, а также в настоящем или будущем. «Я думаю, что это такой мощный способ контролировать наши собственные интерпретации», - говорит он.