У вас закончился пробный период!
Для полного доступа к функционалу, пожалуйста, оплатите премиум подписку
FC
Цифровой филолог (Даня Скоринкин)
https://t.me/fckndh
Возраст канала
Создан
Язык
Русский
-
Вовлеченность по реакциям средняя за неделю
-
Вовлеченность по просмотрам средняя за неделю

Digital Humanities, количественные методы анализа текстов, вычислительная филология, компьютерная лингвистика, бытование текстов, языка и литературы в эпоху чат-гопоты, умных машин и безумных людей

Ранее известен как Ебаный DH

Ведёт Даня @skorinkin

Сообщения Статистика
Репосты и цитирования
Сети публикаций
Сателлиты
Контакты
История
Топ категорий
Здесь будут отображены главные категории публикаций.
Топ упоминаний
Здесь будут отображены наиболее частые упоминания людей, организаций и мест.
Найдено 11 результатов
Мем с курящим траву Илоном Маском, поверх которого тут был наложен Ю.М. Лотман, плохо состарился (как и сам Илон Маск и все, что с ним связано), поэтому уберем его, наконец.. Пусть тут лучше сверкает мой еблет, так хотя бы вы знаете, что за каналом стоит (сидит, лежит) конкретный живой человек Даня Скоринкин
12.03.2025, 22:07
t.me/fckndh/183
На днях будет 3 года моей работы в Потсдаме. Поэтому пост не о науке, а о жизни цифрового филолога. Расскажу о своем опыте существования в немецкой академии: плюсы, минусы, подводные камни🙂 М.б. кому-то эта перспектива поможет понять что вам это не надо что-то о себе. Поехали:

1. Плюсы немецкой академической жизни на контрасте с московской (NB: Москва — не Россия)

· Нет авралов. За эти 3 года я разучился работать по ночам (особенно когда кончил преподавать в Вышке удаленно) и научился отдыхать в выходные. В немецкой академии всё делают сильно заранее. Приглашая человека провести у вас лекцию через год, вы можете выяснить, что его расписание “на через год” уже расписано. В апреле я сам провожу школу по Digital Humanties — и преподавателей я начал звать еще прошлой весной! А летом для них уже были забронированы отели.

· Человечность в обществе и в академии. Германия в целом после Москвы поражает тем, сколько внимания уделяется ивалидам, людям с особенностями, их семьям, маломобильным и незрячим и т.п. Люди в инвалидных колясках сами ходят в супермаркеты, ездят на автобусах, выходят на демонстрации, приезжают на конференции… На некоторых конференциях организуют и бэбиситтеров для детей участников. В декрет уходят и матери, и отцы, у них общий срок на двоих. В университетских туалетах лежат бесплатные тампоны и прокладки. Студенты сами организуют службы психподдержки…

· Чистая природа. Только в Германии я понял, как грязны парки и леса Москвы и Подмосковья. В Москве с её киберпанковым шармом круто жить, но за природой придется пилить километров 200. Здесь леса с косулями, зайцами и белками встроены в городские кварталы и университетские кампусы (не только в Потсдаме) Можно иметь хорошую квалифицированную работу — и потом идти в лес к зверушкам (прямо сейчас пишу этот пост в университете, а за окном на ветку дуба сел большой зеленый дятел).

2. Минусы

· Все медленно. Обратная сторона плюса номер 1. В Москве все двигаются быстрее, проекты растут в телеграм-чатиках в режиме 24/7, а не от зума к зуму раз в 3 недели. В немецкой академии вместо нормального проектного менеджмента часто происходят бесконечные заседания и стенограммы.

· Консерватизм. Хотя Россия иногда пытается изображать “оплот традиционных ценностей”, это, конечно, чистый постмодернистский китч. Наши “традиции” придуманы/переизобретены позавчера и никто за них крепко не держится, при необходимости переобувание мгновенное. А вот в немецкой академии можно встретить настоящий глубинный консерватизм. Отсюда куда более строгое отношение к дисциплинарным границам и вера в свою колею. Многие местные студенты свято верят, что как гуманитарии должны исключительно ходить с тетрадочкой в библиотеку, а к компьютеру относиться как к дьявольскому наущению. Вместо энтузиазма, который я видел рассказывая про Digital Humanities гуманитарным студентам в Москве, здесь я чаще вижу вежливое недоумение и испуг. Еще в Германии для большинства работ важен формальный диплом по специальности — вера в степени и формальные квалификации очень высока. Чтобы работать в библиотеке, надо отучиться на библиотекаря и т.д.

· Датеншутц как религия. Немцы очень боятся за свои данные. Немец спокойно купается голым на глазах у всего города, но не хочет заводить аккаунт в Google, т.к. данные уйдут американским капиталистам. Электронные госуслуги? Нет, это опасно, примите пожалуйста 20 бумажных писем. Почтальон не нашел ваш адрес? Хм, жаль, ведь в этом письме был ваш рабочий договор, а в следующем — зарплатная карта😅 Те самые гуманитарные студенты не хотят пользоваться ChatGPT для разметки, потому что “а вдруг журналы 1956 года, которые я исследую, содержат персональные данные”? Datenschutz — национальная паранойя, и как с этим жить 21й век — неясно.

3. Небольшое Итого/ Fazit

Думаю, мне нужно было вырваться из московского беличьего колеса сюда. Я выехал из “колеи” в “лес”, расширил горизонты, а еще стал добрее. Москва с её темпами и достигаторством ожесточает — здесь же снова вспоминаешь, что вокруг люди и они важнее метрик и KPI. Но застрять здесь на много лет я бы все еще не хотел.
12.03.2025, 19:51
t.me/fckndh/181
Сколько статей пишут о Пушкине каждый год? Чем отличается образ Пушкина в учебниках, в медиа и в науке? Как ученые используют цифровые коллекции пушкинских текстов? Зачем нужен проект Пушкин ⟨цифровой⟩?

Жизнь классики в цифровом пространстве — давно волнующая меня тема (я какое-то время занимался цифровой реинкарнацией текстов Льва Толстого), а вот в пятницу 7 марта будет по этой теме мероприятие в Digital-Humanities-центре ИТМО, вокруг проекта Пушкин ⟨цифровой⟩. Пишут, что можно заглянуть онлайн без регистрации и СМС 💁‍♂️

🗓7 марта, пятница

🕐13:00 мск

📍DH-центр ИТМО (Санкт-Петербург, Биржевая, 16) и онлайн

——

Чтобы прийти в DH-центр ИТМО очно, надо зарегистрироваться по ссылке.

Для онлайн-слушателей регистрация не обязательна, ко встрече можно сразу подключиться здесь
5.03.2025, 14:30
t.me/fckndh/180
И тут я увидел ЭТО: компьютерный анализ текстов о встречах с НЛО 👽

Филология хороша тем, что её инструментарий применим далеко за пределами художественной литературы. И я сейчас даже не про кейс Абатурова 🙂 Любая история, любой изложенный кем-то нарратив может быть препарирован филологом. А если филолог программирующий (вот как я) — он еще и попытается автоматизировать и масштабировать свой анализ 🤖

На последней конференции Computational Humanities Research в датском Орхусе я слушал доклад ученых из Дрездена о поиске «сюжетного поворота» (turning point) в рассказах о встречах с НЛО 🛸 Рассказы о встречах с НЛО хороши своей регулярной двучастной структурой: сначала идет вступление, где все обычно и нормально, а потом БДЫЩ💥 — и переход к необычному / паранормальному. И конечно, компьютерные филологи не были бы компьютерными филологами, если бы не попытались научиться распознавать этот БДЫЩ переход автоматически, а также понять, какие формальные признаки его сопровождают.

Откуда взялись тексты про НЛО?

Ученые взяли тексты с сайта UFO Stalker, где на тот момент было больше 110 тысяч историй о неопознанных объектах в небе. Сейчас их там еще больше — сайт пополняется почти ежедневно. Вот, например, чье-то свидетельство из Англии от 2 марта 2025 (сегодня!), время — 3 часа утра:

sat in garden at 2/3am this morning, saw a cluster of lights appear that suddenly became clear it was in a formation, it almost loooked like a bird or "dragon" and had looked like it had lights on the underneath. was moving way too fast and way too low to be a plane, which i observe here daily.

(кстати, не могу не восхититься обилием метаданных к каждой истории. Тут есть поля для описания формы объекта, траектории полета, предполагаемого удаления от наблюдателя, продолжительности наблюдения, предполагаемой высоты над землей…)

Авторы исследования, правда, метаданные особо не трогали и сосредоточились на текстах. Они сделали случайную выборку в 496 текстов, разметили в них то самое предложение, где происходит переход к описанию появления НЛО, потом сделали автоматическую морфосинтаксическую разметку с помощью пакета Stanza — и изучили, чем эти предложения статистически отличаются от прочих. А еще натренировали модели логистической регрессии предсказывать вероятность того, что предложение является поворотным — чтобы посмотреть, какие признаки будут повышать вероятность.

И что получилось?

Во-первых: turning-point-предложения обычно появляются в относительном начале текста. Истории бывают длинными (свыше 80 предложений), их медианная длина — 12 предложений, но поворотный момент почти всегда происходит в первых 10-20% текста.

Во-вторых, в «поворотных предложениях» аномально часто встречается наречие времени «когда» (when_ADV): примерно в 4 раза чаще, чем в прочих. Информация о наличии этого наречия повышала вероятность в предсказании регрессионной модели (например, для предложений в начале текста вероятность поднималась примерно с 35% до 65%). А вот наречие «тогда» (then) и другой вариант когда (предлог «as») такого эффекта не дают, хотя тоже часто встречаются при описании turning-point.

So what? / И чо? / Und jetzt 🤔

Вы конечно спросите, зачем это надо? Я думаю, тут, как часто бывает в Digital Humanities, важнее не конкретный объект исследования, а поиски метода. Как пишут сами авторы, их интересует computational modeling of narratives, т.е. моделирование того, как люди рассказывают истории, как в них передается саспенс и внезапный поворот. А это, согласитесь, актуально и для сценариста сериала на Нетфликсе, и для ютубера, и для автора предвыборного ролика…
2.03.2025, 21:05
t.me/fckndh/179
Репост
55
16
741
Пушкин и геометрия, или Что бы еще посчитать в литературе?

Еще до появления "сферического коня в вакууме" Яков Перельман придумал "конический холм на равнине".
Демонстрируя широкий кругозор, он составил задачки еще и по Толстому и Шекспиру.

Перельман Я.И. Новый задачник по геометрии. 1925

*Ответ в первом комментарии.
18.02.2025, 12:50
t.me/fckndh/178
Тем временем в Потсдаме после примерно месяца тухлой апрельской погоды дали настоящий снег — и ваш ебобо-филолог забыл про все свои исследовательские, расследовательские и прочие там просветительские дела — и побежал принимать снеговые ванны!🛁 ❄️☃️😶‍🌫️

#не_про_dh
13.02.2025, 14:55
t.me/fckndh/177
Лжежурналисты, Абатуров и ФСБ

Ненадолго вернемся к доносчику Ивану Абатурову. Он продолжает порождать тексты, воспроизводя в них дивный стиль своего фантома “Анны Коробковой”. На этот раз Абатуров написал у себя в ВК призыв жаловаться в ФСБ на издание It's My City. Начинается текст характерным коробковским заглавием «О [тех-то]»:

О лжежурналистах ликвидированного СМИ It's My City

Дальше Иван рассказывает, что в его городе творятся страшные вещи:

В Екатеринбурге звонят людям молодые личности, которые говорят, что они являются журналистами It's My City, и просят дать комментарий для СМИ.

Представьте, поднимаете вы трубку телефона — а там молодая личность… Это пострашнее гроба на колесиках. К счастью, у Абатурова есть оберег: выписка из реестра Роскомнадзора. Выписка говорит, что It's My City как СМИ ликвидировано, а следовательно, никаких журналистов быть не может:

Следовательно, прекращение деятельности It's My City означало, что все его журналисты перестали быть журналистами. Мне один из их сотрудников написал - мол они все равно якобы несмотря на прекращение лицензии остались журналистами. Разумеется, они перестали быть журналистами с момента прекращения действия лицензии. То есть их деятельность незаконна. Неизвестно, для какой цели и для какой организации они собирают информацию.

В мире Абатурова журналиста делает журналистом ярлык от Роскомнадзора. Ну как писателя в известные времена делал писателем членский билет СП, а все остальные были тунеядцами. Поэтому Абатуров призвал стучать на них в ФСБ, добавив сакраментальное русское «там разберутся»:

Как только такой лжежурналист (раз он журналистом по закону не является, а журналистом назвался, то он лжежурналист) Вам предлагает поговорить, то сообщите номер телефона, с которого он звонил, в ФСБ России. Там разберутся - по номеру можно легко их найти. В ФСБ России можно обратиться по электронной почте.

Из языковых примет Коробковой выше вы уже могли заметить
• слово „мол“ без запятых и после тире (Абатуров, как многие, ставит дефис, но функционально это тире): “написал - мол они”
• Начало нового предложения с “То есть“
• Вы с большой буквы в текстах, где это не является обращением к конкретному лицу

Ну и конечно, в той части, где Иван Абатуров излагает мораль и объясняет, какому коварному злу он противостоит своими доносами в ФСБ, появляется коронная формула Коробковой «Я против любого нарушения закона»:

Обратите внимание, что эти лжежурналисты It's My City вполне могли бы стать сотрудниками зарегистрированных СМИ, но похоже не захотели. Ведь зарегистрированное СМИ вынуждено нести ответственность за свои публикации. А к It's My City нельзя подать иск, если они Вам припишут то, что Вы не сказали. Потому, что юридически It's My City нет. Я против любого нарушения закона.

Мотивацию своих действий Иван представляет как самую благородную: он спасает людей, которые вдруг случайно станут жертвами страшных “лжежурналистов”. Ведь “если потом на сайте организации, чья деятельность в России запрещена, появится Ваше выступление, то Вы познакомитесь с правоохранительными органам”. И только ФСБ по наводке Абатурова и его команды смогут уберечь граждан от такой беды:

Не подумайте, что лжежурналисты It's My City преследуют хорошую цель. Они хотят любой ценой заработать гонорар, а что будет с тем, кто в их ложь поверил и им дал комментарий, их вообще не интересует. Только передачей на них сведений в ФСБ России можно заставить их прекратить вредить законопослушным гражданам.

Верный своему жизненному правилу «быть ходячей прокуратурой», Иван Абатуров даже предоставляет услугу «проверки» любых подозрительных журналистов:

Если к Вам кто-то обратится с рассказом, что он журналист, то можете мне написать - могу сообщить журналист ли он.

Глядя на Ивана, подумываю предложить аналогичную услугу. Если к вам кто-то обратится с рассказом, что он журналист Иван Абатуров, то можете мне написать — могу сообщить, что он доносчица Анна Коробкова😉
12.02.2025, 21:29
t.me/fckndh/176
(продолжение)

🚬 Атмосферные детали: и ChatGPT, и писатель вводят в рассказ похожие мелкие декорации: в сгенерированном рассказе тишину в университетской аудитории нарушает «лишь слегка вибрирующий шум кондиционера», а у Александра Сорге герои сидят на кухне, где «жужжит над столом одинокая лампочка». Похоже, такие детали а ля Дэвид Линч стали клишированными и их легко вынимают из общего «коллективного бессознательного» и люди, и нейросети.

Итого:
У писателя-человека получился емкий и погружающий в себя кусочек антиутопии, хотя и с шаблонными деталями. Нейросеть, в отличие от человека, не придумывает мир сама, она по умолчанию создает самый заурядный реалистичный сеттинг и конструирует его самыми стандартными литературными приемами: нарратив в третьем лице, прошедшее время и натужный хэппи энд в конце 🤡
9.02.2025, 11:41
t.me/fckndh/175
Кафкианская киберпанк-антиутопия с Госреальностью против хэппи-энда в тюрьме: как мы промптили писателя и ChatGPT сюжетом про студента и дипфейк

Дорогой подписчик Navi в комментах к посту про GPT-поэзию справедливо указал, что честным сравнением литературных талантов людей с талантами роботов было бы заставить поэтов-людей писать ровно по тем же инструкциям что писала нейросеть. Так мы убрали бы из эксперимента неравенство в интенциональности: у человека при написании текста есть какие-то более или менее осознанные устремления, а модели их сообщает промт-затравка, сконструированная исследователем.

Ученые в статье про поэзию так не делали — и понятно почему: ставить такой эксперимент в нужном масштабе долго и дорого. Вообще не факт, что найдется достаточное количество профессиональных поэтов, которые согласятся в таком участвовать. Но в меньших масштабах такие эксперименты возможны. И в одном из них я соучаствовал. Вместе с коллегами из издания “Подтекст” мы взяли один и тот же короткий набросок сюжета — и предложили его ChatGPT и живому петербургскому писателю Александру Сорге:

Порядочный преподаватель в университете со стажем работы более 20 лет отправил студента на пересдачу. Он всегда так делал, когда видел в студентах потенциал и хотел, чтобы они стремились к большему. Но этот студент был из числа тех, кто не просто обижается на преподавателя, но и готов отомстить ему за оценку «неудовлетворительно». Он создает видео дипфейк, где этот преподаватель пристает к одной из студенток у себя в кабинете. В итоге суд приговаривает его к шести годам заключения с лишением права на преподавательскую деятельность.

Что получилось у обоих авторов — можно почитать тут. А отличия были таковы:

🔭Точка зрения/перспектива: в тексте ChatGPT повествование ведется от третьего лица, а текст Сорге — это диалог. Живой диалог (как в драме) с живыми героями — прием, который по большому счету сделал роман королем литературы в 19 веке. Прямая речь дает читателю очень киношное ощущение присутствия на сцене. Но нейросеть как всегда оказалась унылым архаистом, построив весь текст в виде авторского повествования в третьем лице, вообще без прямой речи персонажей. Диалоговая форма — это уже слишком смело для ChatGPT: она по умолчанию пишет от третьего лица, а чтобы герои беседовали, ее нужно специально попросить, указав это в запросе. Играть с формой так же свободно, как писатель, нейросеть не может.

⏳Время: ChatGPT написала весь рассказ строго в прошедшем времени. Это снова признак консервативного подхода к творчеству. Так написаны Библия, летописи, исторические хроники и другие «каноничные» во всех смыслах книги. Так же пишутся протоколы, научные статьи и другие сухие формальные тексты, предполагающие отстраненность от событий. Писатель же начал с использования настоящего времени («Мужчина сидит в большом черном кресле»), что создает эффект присутствия. И лишь по ходу диалога повествование неуловимо переключается на формы прошедшего времени: в одном фрагменте герой «парирует», а в следующем уже «вспылил». Далее повествование идет в прошедшем времени. Писатель снова смелее и свободнее обращается с текстом.

🌏Сюжет и художественная вселенная: ChatGPT просто по порядку изложила все, о чем ее просили, не создавая объемного мира вокруг. Фантазию модель проявила только в двух последних абзацах, описывая просветительскую деятельность героя в тюрьме и завершая драматичную историю на позитивной ноте (LLMки натаскивают на позитив). Писатель же создал киберпанк-антиутопию, перенеся историю преподавателя в кафкианский мир с виртуальной “Госреальностью” и цифровым судом. У ChatGPT никакой новой художественной вселенной не возникает: об этом надо просить явно.
9.02.2025, 11:41
t.me/fckndh/174
6.02.2025, 18:19
t.me/fckndh/172
6.02.2025, 18:19
t.me/fckndh/173
Результаты поиска ограничены до 100 публикаций.
Некоторые возможности доступны только премиум пользователям.
Необходимо оплатить подписку, чтобы пользоваться этим функционалом.
Фильтр
Тип публикаций
Хронология похожих публикаций:
Сначала новые
Похожие публикации не найдены
Сообщения
Найти похожие аватары
Каналы 0
Высокий
Название
Подписчики
По вашему запросу ничего не подошло