Цифровой филолог (Даня Скоринкин)

Your trial period has ended!

For full access to functionality, please pay for a premium subscription

https://t.me/fckndh

Channel age

Created

Language

Russian

ER (week)

ERR (week)

Digital Humanities, количественные методы анализа текстов, вычислительная филология, компьютерная лингвистика, бытование текстов, языка и литературы в эпоху чат-гопоты, умных машин и безумных людей

Ранее известен как Ебаный DH

Ведёт Даня @skorinkin

Messages Statistics

Top categories

Main categories of messages will appear here.

Top mentions

The most frequent mentions of people, organizations and places appear here.

Found 11 results

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

222

1.7 k

Мем с курящим траву Илоном Маском, поверх которого тут был наложен Ю.М. Лотман, плохо состарился (как и сам Илон Маск и все, что с ним связано), поэтому уберем его, наконец.. Пусть тут лучше сверкает мой еблет, так хотя бы вы знаете, что за каналом стоит (сидит, лежит) конкретный живой человек Даня Скоринкин

03/12/2025, 22:07

t.me/fckndh/183

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

152

1.2 k

На днях будет 3 года моей работы в Потсдаме. Поэтому пост не о науке, а о жизни цифрового филолога. Расскажу о своем опыте существования в немецкой академии: плюсы, минусы, подводные камни🙂 М.б. кому-то эта перспектива поможет понять что вам это не надо что-то о себе. Поехали:

1. Плюсы немецкой академической жизни на контрасте с московской (NB: Москва — не Россия)

· Нет авралов. За эти 3 года я разучился работать по ночам (особенно когда кончил преподавать в Вышке удаленно) и научился отдыхать в выходные. В немецкой академии всё делают сильно заранее. Приглашая человека провести у вас лекцию через год, вы можете выяснить, что его расписание “на через год” уже расписано. В апреле я сам провожу школу по Digital Humanties — и преподавателей я начал звать еще прошлой весной! А летом для них уже были забронированы отели.

· Человечность в обществе и в академии. Германия в целом после Москвы поражает тем, сколько внимания уделяется ивалидам, людям с особенностями, их семьям, маломобильным и незрячим и т.п. Люди в инвалидных колясках сами ходят в супермаркеты, ездят на автобусах, выходят на демонстрации, приезжают на конференции… На некоторых конференциях организуют и бэбиситтеров для детей участников. В декрет уходят и матери, и отцы, у них общий срок на двоих. В университетских туалетах лежат бесплатные тампоны и прокладки. Студенты сами организуют службы психподдержки…

· Чистая природа. Только в Германии я понял, как грязны парки и леса Москвы и Подмосковья. В Москве с её киберпанковым шармом круто жить, но за природой придется пилить километров 200. Здесь леса с косулями, зайцами и белками встроены в городские кварталы и университетские кампусы (не только в Потсдаме) Можно иметь хорошую квалифицированную работу — и потом идти в лес к зверушкам (прямо сейчас пишу этот пост в университете, а за окном на ветку дуба сел большой зеленый дятел).

2. Минусы

· Все медленно. Обратная сторона плюса номер 1. В Москве все двигаются быстрее, проекты растут в телеграм-чатиках в режиме 24/7, а не от зума к зуму раз в 3 недели. В немецкой академии вместо нормального проектного менеджмента часто происходят бесконечные заседания и стенограммы.

· Консерватизм. Хотя Россия иногда пытается изображать “оплот традиционных ценностей”, это, конечно, чистый постмодернистский китч. Наши “традиции” придуманы/переизобретены позавчера и никто за них крепко не держится, при необходимости переобувание мгновенное. А вот в немецкой академии можно встретить настоящий глубинный консерватизм. Отсюда куда более строгое отношение к дисциплинарным границам и вера в свою колею. Многие местные студенты свято верят, что как гуманитарии должны исключительно ходить с тетрадочкой в библиотеку, а к компьютеру относиться как к дьявольскому наущению. Вместо энтузиазма, который я видел рассказывая про Digital Humanities гуманитарным студентам в Москве, здесь я чаще вижу вежливое недоумение и испуг. Еще в Германии для большинства работ важен формальный диплом по специальности — вера в степени и формальные квалификации очень высока. Чтобы работать в библиотеке, надо отучиться на библиотекаря и т.д.

· Датеншутц как религия. Немцы очень боятся за свои данные. Немец спокойно купается голым на глазах у всего города, но не хочет заводить аккаунт в Google, т.к. данные уйдут американским капиталистам. Электронные госуслуги? Нет, это опасно, примите пожалуйста 20 бумажных писем. Почтальон не нашел ваш адрес? Хм, жаль, ведь в этом письме был ваш рабочий договор, а в следующем — зарплатная карта😅 Те самые гуманитарные студенты не хотят пользоваться ChatGPT для разметки, потому что “а вдруг журналы 1956 года, которые я исследую, содержат персональные данные”? Datenschutz — национальная паранойя, и как с этим жить 21й век — неясно.

3. Небольшое Итого/ Fazit

Думаю, мне нужно было вырваться из московского беличьего колеса сюда. Я выехал из “колеи” в “лес”, расширил горизонты, а еще стал добрее. Москва с её темпами и достигаторством ожесточает — здесь же снова вспоминаешь, что вокруг люди и они важнее метрик и KPI. Но застрять здесь на много лет я бы все еще не хотел.

03/12/2025, 19:51

t.me/fckndh/181

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

825

Сколько статей пишут о Пушкине каждый год? Чем отличается образ Пушкина в учебниках, в медиа и в науке? Как ученые используют цифровые коллекции пушкинских текстов? Зачем нужен проект Пушкин ⟨цифровой⟩?

Жизнь классики в цифровом пространстве — давно волнующая меня тема (я какое-то время занимался цифровой реинкарнацией текстов Льва Толстого), а вот в пятницу 7 марта будет по этой теме мероприятие в Digital-Humanities-центре ИТМО, вокруг проекта Пушкин ⟨цифровой⟩. Пишут, что можно заглянуть онлайн без регистрации и СМС 💁‍♂️

🗓7 марта, пятница

🕐13:00 мск

📍DH-центр ИТМО (Санкт-Петербург, Биржевая, 16) и онлайн

——

Чтобы прийти в DH-центр ИТМО очно, надо зарегистрироваться по ссылке.

Для онлайн-слушателей регистрация не обязательна, ко встрече можно сразу подключиться здесь

03/05/2025, 14:30

t.me/fckndh/180

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

102

967

И тут я увидел ЭТО: компьютерный анализ текстов о встречах с НЛО 👽

Филология хороша тем, что её инструментарий применим далеко за пределами художественной литературы. И я сейчас даже не про кейс Абатурова 🙂 Любая история, любой изложенный кем-то нарратив может быть препарирован филологом. А если филолог программирующий (вот как я) — он еще и попытается автоматизировать и масштабировать свой анализ 🤖

На последней конференции Computational Humanities Research в датском Орхусе я слушал доклад ученых из Дрездена о поиске «сюжетного поворота» (turning point) в рассказах о встречах с НЛО 🛸 Рассказы о встречах с НЛО хороши своей регулярной двучастной структурой: сначала идет вступление, где все обычно и нормально, а потом БДЫЩ💥 — и переход к необычному / паранормальному. И конечно, компьютерные филологи не были бы компьютерными филологами, если бы не попытались научиться распознавать этот БДЫЩ переход автоматически, а также понять, какие формальные признаки его сопровождают.

Откуда взялись тексты про НЛО?

Ученые взяли тексты с сайта UFO Stalker, где на тот момент было больше 110 тысяч историй о неопознанных объектах в небе. Сейчас их там еще больше — сайт пополняется почти ежедневно. Вот, например, чье-то свидетельство из Англии от 2 марта 2025 (сегодня!), время — 3 часа утра:

sat in garden at 2/3am this morning, saw a cluster of lights appear that suddenly became clear it was in a formation, it almost loooked like a bird or "dragon" and had looked like it had lights on the underneath. was moving way too fast and way too low to be a plane, which i observe here daily.

(кстати, не могу не восхититься обилием метаданных к каждой истории. Тут есть поля для описания формы объекта, траектории полета, предполагаемого удаления от наблюдателя, продолжительности наблюдения, предполагаемой высоты над землей…)

Авторы исследования, правда, метаданные особо не трогали и сосредоточились на текстах. Они сделали случайную выборку в 496 текстов, разметили в них то самое предложение, где происходит переход к описанию появления НЛО, потом сделали автоматическую морфосинтаксическую разметку с помощью пакета Stanza — и изучили, чем эти предложения статистически отличаются от прочих. А еще натренировали модели логистической регрессии предсказывать вероятность того, что предложение является поворотным — чтобы посмотреть, какие признаки будут повышать вероятность.

И что получилось?

Во-первых: turning-point-предложения обычно появляются в относительном начале текста. Истории бывают длинными (свыше 80 предложений), их медианная длина — 12 предложений, но поворотный момент почти всегда происходит в первых 10-20% текста.

Во-вторых, в «поворотных предложениях» аномально часто встречается наречие времени «когда» (when_ADV): примерно в 4 раза чаще, чем в прочих. Информация о наличии этого наречия повышала вероятность в предсказании регрессионной модели (например, для предложений в начале текста вероятность поднималась примерно с 35% до 65%). А вот наречие «тогда» (then) и другой вариант когда (предлог «as») такого эффекта не дают, хотя тоже часто встречаются при описании turning-point.

So what? / И чо? / Und jetzt 🤔

Вы конечно спросите, зачем это надо? Я думаю, тут, как часто бывает в Digital Humanities, важнее не конкретный объект исследования, а поиски метода. Как пишут сами авторы, их интересует computational modeling of narratives, т.е. моделирование того, как люди рассказывают истории, как в них передается саспенс и внезапный поворот. А это, согласитесь, актуально и для сценариста сериала на Нетфликсе, и для ютубера, и для автора предвыборного ролика…

03/02/2025, 21:05

t.me/fckndh/179

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

Repost

741

Пушкин и геометрия, или Что бы еще посчитать в литературе?

Еще до появления "сферического коня в вакууме" Яков Перельман придумал "конический холм на равнине".
Демонстрируя широкий кругозор, он составил задачки еще и по Толстому и Шекспиру.

Перельман Я.И. Новый задачник по геометрии. 1925

*Ответ в первом комментарии.

02/18/2025, 12:50

t.me/fckndh/178

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

139

661

Тем временем в Потсдаме после примерно месяца тухлой апрельской погоды дали настоящий снег — и ваш ебобо-филолог забыл про все свои исследовательские, расследовательские и прочие там просветительские дела — и побежал принимать снеговые ванны!🛁 ❄️☃️😶‍🌫️

#не_про_dh

02/13/2025, 14:55

t.me/fckndh/177

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

115

809

Лжежурналисты, Абатуров и ФСБ

Ненадолго вернемся к доносчику Ивану Абатурову. Он продолжает порождать тексты, воспроизводя в них дивный стиль своего фантома “Анны Коробковой”. На этот раз Абатуров написал у себя в ВК призыв жаловаться в ФСБ на издание It's My City. Начинается текст характерным коробковским заглавием «О [тех-то]»:

О лжежурналистах ликвидированного СМИ It's My City

Дальше Иван рассказывает, что в его городе творятся страшные вещи:

В Екатеринбурге звонят людям молодые личности, которые говорят, что они являются журналистами It's My City, и просят дать комментарий для СМИ.

Представьте, поднимаете вы трубку телефона — а там молодая личность… Это пострашнее гроба на колесиках. К счастью, у Абатурова есть оберег: выписка из реестра Роскомнадзора. Выписка говорит, что It's My City как СМИ ликвидировано, а следовательно, никаких журналистов быть не может:

Следовательно, прекращение деятельности It's My City означало, что все его журналисты перестали быть журналистами. Мне один из их сотрудников написал - мол они все равно якобы несмотря на прекращение лицензии остались журналистами. Разумеется, они перестали быть журналистами с момента прекращения действия лицензии. То есть их деятельность незаконна. Неизвестно, для какой цели и для какой организации они собирают информацию.

В мире Абатурова журналиста делает журналистом ярлык от Роскомнадзора. Ну как писателя в известные времена делал писателем членский билет СП, а все остальные были тунеядцами. Поэтому Абатуров призвал стучать на них в ФСБ, добавив сакраментальное русское «там разберутся»:

Как только такой лжежурналист (раз он журналистом по закону не является, а журналистом назвался, то он лжежурналист) Вам предлагает поговорить, то сообщите номер телефона, с которого он звонил, в ФСБ России. Там разберутся - по номеру можно легко их найти. В ФСБ России можно обратиться по электронной почте.

Из языковых примет Коробковой выше вы уже могли заметить
• слово „мол“ без запятых и после тире (Абатуров, как многие, ставит дефис, но функционально это тире): “написал - мол они”
• Начало нового предложения с “То есть“
• Вы с большой буквы в текстах, где это не является обращением к конкретному лицу

Ну и конечно, в той части, где Иван Абатуров излагает мораль и объясняет, какому коварному злу он противостоит своими доносами в ФСБ, появляется коронная формула Коробковой «Я против любого нарушения закона»:

Обратите внимание, что эти лжежурналисты It's My City вполне могли бы стать сотрудниками зарегистрированных СМИ, но похоже не захотели. Ведь зарегистрированное СМИ вынуждено нести ответственность за свои публикации. А к It's My City нельзя подать иск, если они Вам припишут то, что Вы не сказали. Потому, что юридически It's My City нет. Я против любого нарушения закона.

Мотивацию своих действий Иван представляет как самую благородную: он спасает людей, которые вдруг случайно станут жертвами страшных “лжежурналистов”. Ведь “если потом на сайте организации, чья деятельность в России запрещена, появится Ваше выступление, то Вы познакомитесь с правоохранительными органам”. И только ФСБ по наводке Абатурова и его команды смогут уберечь граждан от такой беды:

Не подумайте, что лжежурналисты It's My City преследуют хорошую цель. Они хотят любой ценой заработать гонорар, а что будет с тем, кто в их ложь поверил и им дал комментарий, их вообще не интересует. Только передачей на них сведений в ФСБ России можно заставить их прекратить вредить законопослушным гражданам.

Верный своему жизненному правилу «быть ходячей прокуратурой», Иван Абатуров даже предоставляет услугу «проверки» любых подозрительных журналистов:

Если к Вам кто-то обратится с рассказом, что он журналист, то можете мне написать - могу сообщить журналист ли он.

Глядя на Ивана, подумываю предложить аналогичную услугу. Если к вам кто-то обратится с рассказом, что он журналист Иван Абатуров, то можете мне написать — могу сообщить, что он доносчица Анна Коробкова😉

02/12/2025, 21:29

t.me/fckndh/176

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

676

(продолжение)

🚬 Атмосферные детали: и ChatGPT, и писатель вводят в рассказ похожие мелкие декорации: в сгенерированном рассказе тишину в университетской аудитории нарушает «лишь слегка вибрирующий шум кондиционера», а у Александра Сорге герои сидят на кухне, где «жужжит над столом одинокая лампочка». Похоже, такие детали а ля Дэвид Линч стали клишированными и их легко вынимают из общего «коллективного бессознательного» и люди, и нейросети.

Итого:
У писателя-человека получился емкий и погружающий в себя кусочек антиутопии, хотя и с шаблонными деталями. Нейросеть, в отличие от человека, не придумывает мир сама, она по умолчанию создает самый заурядный реалистичный сеттинг и конструирует его самыми стандартными литературными приемами: нарратив в третьем лице, прошедшее время и натужный хэппи энд в конце 🤡

02/09/2025, 11:41

t.me/fckndh/175

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

621

Кафкианская киберпанк-антиутопия с Госреальностью против хэппи-энда в тюрьме: как мы промптили писателя и ChatGPT сюжетом про студента и дипфейк

Дорогой подписчик Navi в комментах к посту про GPT-поэзию справедливо указал, что честным сравнением литературных талантов людей с талантами роботов было бы заставить поэтов-людей писать ровно по тем же инструкциям что писала нейросеть. Так мы убрали бы из эксперимента неравенство в интенциональности: у человека при написании текста есть какие-то более или менее осознанные устремления, а модели их сообщает промт-затравка, сконструированная исследователем.

Ученые в статье про поэзию так не делали — и понятно почему: ставить такой эксперимент в нужном масштабе долго и дорого. Вообще не факт, что найдется достаточное количество профессиональных поэтов, которые согласятся в таком участвовать. Но в меньших масштабах такие эксперименты возможны. И в одном из них я соучаствовал. Вместе с коллегами из издания “Подтекст” мы взяли один и тот же короткий набросок сюжета — и предложили его ChatGPT и живому петербургскому писателю Александру Сорге:

Порядочный преподаватель в университете со стажем работы более 20 лет отправил студента на пересдачу. Он всегда так делал, когда видел в студентах потенциал и хотел, чтобы они стремились к большему. Но этот студент был из числа тех, кто не просто обижается на преподавателя, но и готов отомстить ему за оценку «неудовлетворительно». Он создает видео дипфейк, где этот преподаватель пристает к одной из студенток у себя в кабинете. В итоге суд приговаривает его к шести годам заключения с лишением права на преподавательскую деятельность.

Что получилось у обоих авторов — можно почитать тут. А отличия были таковы:

🔭Точка зрения/перспектива: в тексте ChatGPT повествование ведется от третьего лица, а текст Сорге — это диалог. Живой диалог (как в драме) с живыми героями — прием, который по большому счету сделал роман королем литературы в 19 веке. Прямая речь дает читателю очень киношное ощущение присутствия на сцене. Но нейросеть как всегда оказалась унылым архаистом, построив весь текст в виде авторского повествования в третьем лице, вообще без прямой речи персонажей. Диалоговая форма — это уже слишком смело для ChatGPT: она по умолчанию пишет от третьего лица, а чтобы герои беседовали, ее нужно специально попросить, указав это в запросе. Играть с формой так же свободно, как писатель, нейросеть не может.

⏳Время: ChatGPT написала весь рассказ строго в прошедшем времени. Это снова признак консервативного подхода к творчеству. Так написаны Библия, летописи, исторические хроники и другие «каноничные» во всех смыслах книги. Так же пишутся протоколы, научные статьи и другие сухие формальные тексты, предполагающие отстраненность от событий. Писатель же начал с использования настоящего времени («Мужчина сидит в большом черном кресле»), что создает эффект присутствия. И лишь по ходу диалога повествование неуловимо переключается на формы прошедшего времени: в одном фрагменте герой «парирует», а в следующем уже «вспылил». Далее повествование идет в прошедшем времени. Писатель снова смелее и свободнее обращается с текстом.

🌏Сюжет и художественная вселенная: ChatGPT просто по порядку изложила все, о чем ее просили, не создавая объемного мира вокруг. Фантазию модель проявила только в двух последних абзацах, описывая просветительскую деятельность героя в тюрьме и завершая драматичную историю на позитивной ноте (LLMки натаскивают на позитив). Писатель же создал киберпанк-антиутопию, перенеся историю преподавателя в кафкианский мир с виртуальной “Госреальностью” и цифровым судом. У ChatGPT никакой новой художественной вселенной не возникает: об этом надо просить явно.

02/09/2025, 11:41

t.me/fckndh/174

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

946

02/06/2025, 18:19

t.me/fckndh/172

Цифровой филолог (Даня Скоринкин)

1 858 subscribers

977

02/06/2025, 18:19

t.me/fckndh/173