Language Compression in Twitter Messages
Атягина Анна Петровна
аспирантка кафедры теоретической и прикладной лингвистики Омского государственного университета им. Ф.М. Достоевского, atyagina@gmail.com
Anna P. Atyagina
PhD student at the chair of theoretic and practical linguistics, Dostoevsky Omsk State University, atyagina@gmail.com
Аннотация
В статье анализируются особенности языка популярного интернет-сервиса Twitter. Автор на практических примерах рассматривает уровни языковой компрессии, присущие сообщениям Twitter, касается такого относительно нового явления интернет-коммуникаций, как хэштеги.
Ключевые слова: Twitter, языковая компрессия, уровни языковой компрессии, язык Twitter, хэштеги, интернет-жанр.
Abstracts
The particularities of the new popular Twitter service are analyzed in this article. The author considers the forms of language compression inherent in Twitter messages on practical examples. Besides, the author highlights such a new phenomenon of Internet communications as hash tags.
Key words: Twitter, language compression, levels of language compression, language of Twitter, hash tags.
Одно из новых и наиболее интересных явлений в современном интернете – социальный сервис Twitter, ставший своеобразным результатом развития блогов и социальных сетей. Этот сервис за несколько лет своего существования (с 2006 г.) успел во многом повлиять на организацию общения во всемирной сети, на получение информации как рядовыми пользователями, так и средствами массовой информации. Twitter становится не только средством СМИ для оперативного поиска информации и информаторов, но и влияет на тексты, которые СМИ производят. Так, многие журналисты признают, что теперь создают заголовки и вступления к своим материалам, учитывая особенности Twitter.
На данный момент исследования этого интернет-феномена в лингвистическом аспекте только начинаются, и мы считаем, что их актуальность крайне высока.
Е.И. Горошко дает свое определение Twitter, которое выглядит следующим образом: «“Твиттер” (от англ. twit − щебетать, болтать) − это не традиционный блог в чистом виде, как, например, “Живой Журнал”, а, скорее, средство оперативного общения, гибридная форма, которая соединила в себе свойства нескольких интернет-сервисов: службы мгновенных сообщений, блога, электронной почты и социальной сети»1.
Определяя основные жанрообразующие характеристики Twitter, Е.И. Горошко рассматривает его как комбинированный вторичный жанр с ярко выраженной новостной (функция информирования) и социальной составляющей (контактоустанавливающая, социализирующая и репрезентативная функция).
Одной из жанрообразующих особенностей Twitter является лаконичность сообщений, которые передаются с его помощью (не более 140 символов), и возможность мгновенного распространения информации по цепочке. По нашему мнению, эти свойства Twitter, среди которых на первое место выходят скорость и лаконичность, оказывают несомненное влияние на современную коммуникацию в целом, а при долгосрочном использовании могут привести к существенным изменениям и в языке. Данные механизмы уже привлекли внимание исследователей, в том числе и на русскоязычном материале.
Так, О.Г. Никонорова в своей диссертации «Малые рекламные жанры в прагматическом, когнитивном и ортологическом аспектах» рассматривает механизмы языковой компрессии на примере популярного в 1990-х гг. малого тележанра − бегущей строки. Стоит отметить, что в начале 2000 г. на центральных каналах это было запрещено2. Несмотря на жанровые и функциональные различия (сообщения в Twitter лишь иногда носят рекламный характер), механизмы компрессии текста в сообщениях Twitter и малых рекламных жанрах схожи.
Компрессия – явление, при котором «в одном означающем слито несколько означаемых»3. Она способствует лаконичности, динамичности текста, обогащению его неявно выраженными подтекстовыми смыслами, избавляет текст от ненужного повторения информации, поскольку опускается, редуцируется именно то, что менее информативно значимо4.
Компрессию и ее проявления на языковых уровнях исследуют А.П. Василевский и Ю.М. Эмдина, освещая проявление компрессии на шести уровнях: фонологическом, или графемном (опущение фонем или графем, редукция гласных и т.д.); морфологическом (образование аббревиатур, сложносокращенных слов, бедность в употреблении глагольных времен и наклонений); синтаксическом (использование менее развернутых конструкций); лексическом (опущение слов в тексте); синтактико-лексическом (опущение служебных и вспомогательных слов); семантическом (опущение менее существенной части информации)5.
Все эти уровни компрессии наблюдаются и в Twitter. Вкратце рассмотрим их и приведем примеры из сообщений, опубликованных в микроблогах.
1. Графемный уровень
На графемном уровне в сообщениях пользователей Twitter можно наблюдать опущение некоторых графем с целью сокращения сообщения до необходимых 140 символов. В большинстве случаев эти сокращения подобны принятым в других интернет-сервисах («спсб» − «спасибо»), исключение – связанные с Twitter термины, например, «тви» − («Твиттер»), RT (РТ) – ReTweet («Ретвит») и т.п. Специальных исследований, посвященных этому, нами не обнаружено.
2. Морфологический уровень
Языковая компрессия на морфологическом уровне выражается в образовании аббревиатур, сложносокращенных слов, однако характерных именно для Twitter аббревиатур и сокращений нами замечено не было. Компрессия также проявляется в ограниченности употребления глагольных времен и наклонений, отсутствии сложных конструкций. Подавляющее большинство авторов в Twitter предпочитают разделять одно сложное предложение на несколько простых или использовать ряд неполных предложений: «Решила начать бегать. Навернула кружок у местного водоема. Вроде жива», «Кажется, что я спала сегодня минут 30. В зеркале отражается симпатичная такая панда. А насос внутри качает в ритме драмнбэйс».
3. Синтаксический уровень
На синтаксическом уровне компрессия предусматривает сжатие знаковой структуры путем эллипсиса, грамматической неполноты, бессоюзия, номинализации (свертки). Под синтаксической компрессией понимаются также опрощение, членение, парцелляция, присоединение и другие процессы, способствующие уменьшению размера высказывания.
«Так, важные новости. Вчера Госдеп выдал мне денег. Суточные − 68 долларов!» (парцелляция), «Ненавижу июнь. Ненавижу зарплату за июнь» (неполное предложение), «Я уже год почти не была во Франции. Что-то меня туда тянет опять. Так же, как в Питер» (парцелляция), «Звонят и предлагают работу... в другом городе... правда, специализация немного другая» (парцелляция), «Триптих. Девушка. Мужчина. Медведь http://t.co/Fh0gqScw» (номинализация).
Яркая примета синтаксиса Twitter – то, что каждый предикатив выделяется в отдельное предложение. Особенности сообщений в Twitter в принципе не предполагают использования сложных предложений с большим количеством конструкций.
4. Синтактико-лексический уровень
С точки зрения синтактико-лексических особенностей, Twitter также проявляет все признаки компрессии текста. Наблюдается опущение отдельных слов, хотя служебные и вспомогательные слова страдают здесь не так часто, как в телеграфных сообщениях или в бегущей строке. Twitter устраняет из речи пользователей ненужные «красивости» − эпитеты, сравнения. С одной стороны, речь упрощается: происходит выбор в пользу более короткого и простого. С другой стороны, нередко провоцируется поиск синонимов − люди более внимательно подбирают слова. Сообщение не уместилось в 140 символов? Значит, нужно в нем что-то поменять, отредактировать его так, чтобы не потерять смысл. Сообщения обычных пользователей Twitter начинают напоминать сообщения информагентств: «Жду @zavros2la и прибывающий поезд. И все, до Волгограда буду крайне немногословен )))», «На перекрестке Волгоградской и Кондратюка второй день не работает светофор, приезжайте все туда − будет весело!», «Кроксы купили всех блогеров в этой стране», «На Маяковского открылись Суши-Терра!», «Детский сад под окном гуляет под Синатру».
5. Семантический уровень
В сообщениях Twitter очень часто приходится опускать менее значимую информацию. Чаще всего к ней относится информация описательная, конкретизирующая происходящее (за подробностями нередко предлагается перейти по предложенной ссылке): «Сегодня утром разработчики меня порадовали ^__^ наконец-то сделали архив и добавили интервью с Зотиной http://autolady55.ru/», «А мы напоминаем, что интерактивную Карту Дня города можно посмотреть на ОмскПресс. Вот тут прямо − по ссылочке кликните http://omskpress.ru/blogs/mess/572/», «Фронтовики получат свидетельства на жилье к празднику города http://bit.ly/Qllwek #omsk #novosti», «пошлииии! мы идем в субботу в обед примерно. Вот тут инфа http://ngs55.ru/news/603657/view/».
Однако, по нашему мнению, основной способ семантической компрессии в Twitter – использование хэштегов, то есть слов или словосочетаний с символом #, обозначающих ситуацию, место, тему разговора или что бы то ни было еще.
При анализе текстов сообщений Twitter целесообразно опираться не на приметы телеграфного стиля, а на общие принципы компрессии текста, механизмы которой позволяют свернуть текст при передаче и развернуть его при восприятии, не потеряв при этом наиболее важную, значимую, воздействующую информацию. Т.А. ван Дейк, основываясь на когнитивной теории употребления языка, исходит из того, что мы понимаем текст только тогда, когда понимаем ситуацию, о которой идет речь. Поэтому так называемые модели ситуаций необходимы в качестве основы интерпретации текста. Использование моделей объясняет, почему слушающие прекрасно понимают имплицитные и неясные фрагменты текстов: в этом случае они активизируют соответствующие фрагменты ситуационной модели6.
Мы считаем, что в сообщениях Twitter именно хэштеги передают информацию о модели ситуации. Хэштеги начинаются с символа «#», за которым следует любое сочетание разрешенных в Twitter непробельных символов. Чаще всего это слова или фразы, в которых первая буква каждого слова приведена к верхнему регистру. Они могут встречаться в любой части твита, зачастую пользователи просто добавляют символ «#» перед каким-либо словом.
К неофициальным, но общепринятым правилам использования хэштегов относится выбор в качестве них терминов, релевантных теме сообщения, а также добавление лишь небольшого их количества в одно сообщение. А.В. Коршунов считает, что это позволяет рассматривать их в качестве терминов, которые с большой долей вероятности отражают общую тематику сообщения7.
Часто благодаря хэштегам содержание сообщения удается максимально сократить, например: «Буду #10dec» (#10dec – хэштег, посвященный всероссийскому митингу «За честные выборы» 10 декабря 2011 г). Всем посвященным в смысл этого хэштега станет понятно, где будет автор сообщения, в каком событии он планирует принять участие, а также то, что он занимает активную гражданскую позицию.
Среди других важных свойств хэштегов, помимо удобного и краткого моделирования ситуаций, есть также возможность сделать сообщение максимально публичным. Это свойство делает Twitter идеальным сервисом для распространения информации. Достаточно выбрать курсором тот или иной хэштег, и любой пользователь Twitter сможет в режиме реального времени прочитать все сообщения, в которых поставлен этот хэштег. Это свойство активно используется новостными лентами, например, при указании места, где произошло то или иное событие: «Работы по капитальному ремонту многоквартирных домов выполнены на 33 процента http://bit.ly/QGsPN9 #omsk #novosti», «Цены на бензин будут расти #tomsk», «В Венеции ежедневно заказывают не менее 300 000 порций самого популярного сейчас в Европе коктейля Aperol Spritz #факты #италия». Пользуются этим и рядовые пользователи, например: «Подскажите, где в #omsk можно оцифровать старые видео-записи?», «У копилки на московском снова ДПС #Тула».
Несколько хэштегов могут отсутствовать в конце сообщения, но быть непосредственно включенными в него: «А где можно в #Омск взять белые ленты?», «Начинаем трансляцию инаугурации мэра #omsk Двораковского. #omskmayor», «Из претендентов на «#Евровидение» больше всех жалко Диму #Билан-а, который, взяв пример с #Путин-а, решил в третий раз выиграть». Иногда хэштег становится не только возможностью отметить тему сообщения, но и расставить в нем акценты, показать, что именно хотел сказать автор: «А давай сделаем все как в 2005м. уедем от всех подальше, промокнем до нитки и будем остервенело целоваться под деревом))) #август_обострение», «Сегодня псевдоинтеллектуалы всея твиттера решают судьбу вики #кудабезвас». Возможно, никто не будет искать сообщения по хэштегу #кудабезвас или #август_обострение, но авторы уже выделили эти словосочетания, обратили на него внимание, как на ключевое в сообщении.
Установленных правил использования хештегов не существует, однако неофициально принято использовать не более двух-трех хештегов в сообщении, хотя, разумеется, существуют и исключения. Порядок расположения хештегов отвечает логике сообщения и полностью зависит от его автора. Таким образом, в Twitter присутствует авторский синтаксис.
Думается, уже сегодня можно говорить о возникновении своего, особого языка Twitter, для которого характерна компрессия на всех языковых уровнях, использование хэштегов для моделирования ситуаций, а также собственная риторическая стратегия.