Página do canal Telegram: RAntiquity • @rantiquity

RA

RAntiquity

874 assinantes

1

6

Chatgpt специально для @rantiquity

24.04.2025, 13:37

t.me/rantiquity/688

RA

RAntiquity

874 assinantes

1

15

Plato_pub.mp4

Давно хотела попробовать пакет {gganimate}, но не могла придумать, куда его применить. Наконец придумала 🎸

#plato_mapping

p.s. видео, а не гиф, чтобы можно было поставить на паузу или промотать, ну и ради музыки конечно

24.04.2025, 13:28

t.me/rantiquity/687

RA

RAntiquity

874 assinantes

25

2

194

Коллеги в лс и в чате предложили поменять проекцию. Чтобы два раза не вставать — поменяла сразу палитру и шрифты.

То, что еще утром было quick and dirty, теперь прямо-таки красота (не спорьте).

#maps

23.04.2025, 18:46

t.me/rantiquity/686

RA

RAntiquity

874 assinantes

28

1

229

ясно одно: как ни меняй проекцию, платоновских исследований в Гренладии нет. непорядок

make Greenland great again

23.04.2025, 14:57

t.me/rantiquity/685

RA

RAntiquity

874 assinantes

21

3

237

Первые обобщения
#plato_mapping #scopus

23.04.2025, 14:11

t.me/rantiquity/684

RA

RAntiquity

874 assinantes

19

4

250

(продолжение)

💠 Если по issn gpt опознает издателя очень хорошо, то по названию книги, автору и году просто гадает, таким образом восполнить пробелы в данных #scopus не получилось

💠 Однако оказалось возможным подтянуть, во-первых, некоторые недостающие издательства, а во-вторых, аффилиации через openAlex.

💠 Недостающую информацию также получилось собрать по ORCID, причем работать с публичным API оказалось проще через {httr2}, чем через rorcid (который уже не развивается). Но и там страновая аффилиация указана далеко не всегда, многие журналы ее не требуют и не пишут.

💠 На финальном этапе пришлось нормализовывать написания стран (где-то полностью, где-то коды), добавлять вручную страновые аффилиации (где я в них уверена, например, если знаю, что человек всю жизнь проработал во Франции или в России) — и вообще многое делать руками.

💠 В итоге из 7,400 публикаций примерно 1300 остались без страновой аффилиации, еще около 1000 - без издателя. Это не так уж плохо.

💠 Зато первая разведка дала интересный результат: согласно Scopus, мы на 4-м месте в мире по числу платоноведческих публикаций.

💠 Это почти пасхальное чудо, учитывая непростые условия, в которых существуют наши гуманитарные науки. Количество, конечно, — это только число, надо смотреть цитируемость и многое другое. Это позже. Но количество тоже о чем-то говорит. Вот, например, в США есть научная инфраструктура, и публикаций о Платоне много. А вот в Кувейте или Зимбабве — почти нет. И кажется, хороший знак, что мы по этому показателю ближе к США, чем к Зимбабве.

С Праздником!

20.04.2025, 22:27

t.me/rantiquity/682

RA

RAntiquity

874 assinantes

4

252

20.04.2025, 22:27

t.me/rantiquity/683

RA

RAntiquity

874 assinantes

21

220

Сегодня целый день занимаюсь проверкой и нормализацией датасета #scopus и узнала, что

💠 В мире есть два журнала “Левиафан”, и один из них посвящен Мелвиллу 🐳🐳🐳

💠 “Феникс”, журнал Канадской классической ассоциации, издается в США с 2003 г. 😱😱😱

💠 В Голландии есть журнал о науке и вере под названием “Редиска” (ладно, шучу, Radix) 🥔🥔🥔

💠 Журналы под названием “Логос” издаются в Испании, Литве, России и США

на сегодня это все открытия

17.04.2025, 16:35

t.me/rantiquity/681

RA

RAntiquity

874 assinantes

17

2

192

openai.mp4

Коллеги писали в комментариях к моему первому посту про доступ к Scopus через API, что компания Elsevier не очень щедро делится информацией, и это так. Но все же аффилиацию для авторов, количество цитирований и кое-что еще они отдают (и я даже узнала, какая самая цитируемая статья о Платоне, но об этом в другой раз).

Мысль сделать mapping современного платоноведения меня, тем не менее, не отпускает, поэтому я придумала две хитрости.

💠 Scopus отдает issn (eIssn), а с ними уже можно через {rcrossref} достать имя издателя. Сработало почти везде, но около 300 журналов и серий остались без домика, поэтому пришлось придумать хитрость №2.

💠 Попросить LLM добавить имя издателя по названию журнала и его issn. Получается небыстро, но, пожалуй, быстрее, чем вбивать руками в excel. Пример работы на видео.

Мне это по-прежнему кажется каким-то волшебством 🪄

Скорее всего, мои наукометрические опыты на этом не кончатся, поэтому добавляю новые теги #scopus #api #mapping_plato

15.04.2025, 19:00

t.me/rantiquity/680

RA

RAntiquity

874 assinantes

19

6

262

🧠 Если вы еще не заглядывали в раздел Digital Humanities на “Системном Блоке”, ставший призёром DH Awards 2024 🏆 – сейчас самое время!

Команда продолжает развивать и наполнять портал, и там вас ждут:

📘 Руководства по основным инструментам и подходам DH
📊 Примеры исследований: от анализа текстов до визуализации исторических данных
🧑‍💻 Подборки статей от исследователей и практиков

Заходите, знакомьтесь, пользуйтесь 👉 https://sysblok.ru/dh/

💬 Кстати, если есть темы, которые вам особенно интересны – пишите в комментариях, передадим команде!

14.04.2025, 21:41

t.me/rantiquity/679

RA

RAntiquity

874 assinantes

43

281

Первым делом что? Правильно, прикрутить значок.

13.04.2025, 16:35

t.me/rantiquity/678

RA

RAntiquity

874 assinantes

51

14

464

🎊 Невероятно приятно в этом году в списке победителей DH Awards 2024 видеть множество знакомых имен:

🌟 Кристина Танис и др. с проектом о советском кинематографе (2 место в DH DATASET OR MODEL)
🌟 “Системный блок” сразу в двух рубриках (3 место в DH DATA VISUALIZATION и 3 место в DH RESOURCE)
🌟 Борис Орехов с шахматным препринтом (2 место в рубрике DH SHORT PUBLICATION)
🌟 yours truly с курсом “Компьютерный анализ текста” (3 место в рубрике DH TRAINING MATERIALS)

Огромное спасибо коллегам и студентам за поддержку!
Это очень вдохновляет развивать начатое и стремиться к большему 💪

13.04.2025, 16:09

t.me/rantiquity/677

RA

RAntiquity

874 assinantes

13

15

231

Очень важный разговор о переводе в эпоху нейросетей. Не ответы, а концептуальный каркас для описания расползающейся реальности. Насколько нас устраивает «китайская комната». Считаем ли мы «лингвистическую дрессировку» задачей образования. Умеет ли ИИ ходить по герменевтическому кругу. Можем ли мы что-то противопоставить производству «брехни».

Я не буду пересказывать, потому что очевидно тут важны не выводы, а движение мысли. Но, раз пошла такая пьянка, добавлю от себя две копейки.

- Мы напрасно думаем, что гуманитарное знание производит тексты. Тексты важны, но все наоборот — тексты производят (образуют) людей. Механизм этого образования описан Пьером Адо в «Духовных упражнениях», но идея намного старше. По сути, это и есть гуманистическая программа: тебе дан образ, будь добр, потрудись возвысить его до подобия.

При помощи диалога с самим собой или с другим, а также при помощи письма тот, кто хочет идти вперед, старается быть «мыслящей субстанцией» и таким образом достичь полного преобразования своего представления мира, своего внутреннего климата, а также своего внешнего поведения.

- Перевод производит переводчика — человека, который упражняется в понимании других, ближних и дальних, людей. Думать, что такое понимание нам дано по праву рождения, — большая ошибка. Глупо спрашивать, может ли ИИ переводить вместо меня. Это все равно как спрашивать, может ли он вместо меня заниматься спортом. Хотя бы и так — мы же от этого не перестанем бегать? А если перестанем, то понятно, что далеко не убежим от тех, кто так делает.

В.А. говорит (примерно на 45-й минуте):
Если не поддерживать переводческую культуру, то эпоха булшита приобретет всеобъемлющий характер
Все щебечут по-английски (а теперь и по-латыни), но никто не может добротно перевести маленький кусочек текста. «Переводческая квалификация — это чудовищно сложно». Все так. Переводить очень трудно. Успехи в этой области редки и незаметны, а медалей или денег за них, в отличие от хоккея, не дают. Ну штош, зато у нас есть хоккей. В него ИИ играть пока не умеет.

11.04.2025, 16:59

t.me/rantiquity/676

RA

RAntiquity

874 assinantes

9

5

269

Отчасти чтобы потренироваться делать таблицы с {gt}, отчасти чтобы проще было работать с критическим аппаратом к “Теэтету”, составила вот такой список рукописей первой и второй тетралогии: https://locusclassicus.github.io/philebus/codices.html

p.s. об обновлении great tables с полезными ссылками см. здесь
p.s.s. код и список в формате xlsx в репозитории

10.04.2025, 19:43

t.me/rantiquity/675

RA

RAntiquity

874 assinantes

3

Отчасти чтобы потренироваться работать с {gt}, отчасти чтобы проще было работать с критическим аппаратом к “Теэтету”, сделала вот такой список рукописей первой и второй тетралогии: https://locusclassicus.github.io/philebus/codices.html

p.s. об обновлении great tables с полезными ссылками см. здесь
p.s.s. код и список в формате xlsx в репозитории

10.04.2025, 19:42

t.me/rantiquity/674

RA

RAntiquity

874 assinantes

8

21

983

Если вам кто-нибудь скажет, что у вас зашумленный и нечитаемый график, покажите им вот эту работу Генри Боствика (1787-1837), "A historical, chronological & genealogical chart, exhibiting on a scale of time the principal persons and events of modern history both civil and ecclesiastical, from the year 400 of the Christian era to the present time"

Впрочем, это сказано cum grano salis: такая диаграмма очевидно функционирует не как современный датавиз, по ней надо "водить пальчиком", причем не только вверх-вниз (хронология), но и вправо-влево (география).

Кстати, все Аларихи-Шарлемани на месте, если вчитаться. Даже есть Ruric. При некотором изощрении можно приспособить как шпаргалку по всемирной истории. Но только до Николая I.

8.04.2025, 10:58

t.me/rantiquity/673

RA

RAntiquity

874 assinantes

11

1

265

удобно, что с преобразованием (линейным-нелинейным), прозрачностью и подложкой можно экспериментировать онлайн, сразу видно результат

8.04.2025, 00:04

t.me/rantiquity/672

RA

RAntiquity

874 assinantes

9

5

257

🔹 https://www.oldmapsonline.org ну очень удобный инструмент для географической привязки старых карт, side-by-side view для добавления координат

🔹на сайте есть таймлайн с картами для разных периодов, добавленных другими пользователями

🔹в два шага безо всякого qgis можно добавить и привязать свою карту

🔹но чтобы скачать ее или другой материал в geoTIFF, надо дать деняк приложению 😕

#maps

7.04.2025, 23:53

t.me/rantiquity/671

RA

RAntiquity

874 assinantes

11

5

274

Как я уже писала, подложки Gothenburg Research Infrastructure in Digital Humanities недоступны (c VPN или без), и та же история с Consortium of Ancient World Mappers и с Open Historical Maps. Что там случилось, не знаю, еще летом первый из этих провайдеров работал.

Поэтому разбираюсь, как работать с историческими растрами. Видимо, будет серия заметок гипомнематического (т.е. несколько сумбурного) характера #maps

🔹 скачиваем карту с Wikimedia Commons или из другого источника

🔹 устанавливаем QGIS https://qgis.org/ (нужно ок. 3гб, это бесплатно)

🔹 связываем изображение (например, историческую карту в формате .jpg или .tif) с координатами на поверхности Земли, это называется georeference (если вам повезет, вы найдете уже georeferenced версию, но об этом в другой раз)

Для этого:

🔹 Меню Layer —> Georeferencer, добавляем изображение, определяем 4-8 "контрольные точки" (GCP – Ground Control Points), т.е. вручную задаем их координаты. Потом нажимаем кнопку Start Georeferencing, в рабочей директории появится геопривязанный файл. Вот тут неплохое видео о том, как это делается.

🔹 После этого можно использовать растр вместе с leaflet, он будет масштабироваться и т.п.

library(leaflet)
library(terra)

gallia <- rast("gallia_georef.tif")

# проверка CRS
crs(gallia)

leaflet() |>
addTiles() |>
addRasterImage(gallia, opacity = 0.5, project = FALSE)

(продолжение следует)

7.04.2025, 20:34

t.me/rantiquity/670

RA

RAntiquity

874 assinantes

2

230

А никто не знает случайно, куда делась подложка у Digital Atlas of the Roman Empire (DARE)?

https://dh.gu.se/tiles/imperium/%7Bz%7D/%7Bx%7D/%7By%7D.png больше не работает или отключена

4.04.2025, 17:43

t.me/rantiquity/669

RA

RAntiquity

874 assinantes

7

3

245

Отличный баг. Походы Цезаря в Хорватию и Португалию 🥲 Вот что бывает, если не очень внимательно отнестись к выбору подложки. (отсюда)

4.04.2025, 17:00

t.me/rantiquity/668

RA

RAntiquity

874 assinantes

28

8

551

2.04.2025, 21:46

t.me/rantiquity/667

RA

RAntiquity

874 assinantes

23

14

622

🎉 Коллеги показали очень смешной и бесполезный пакет для R, называется {celebrate}

Единственная функция этого пакета — дополнить вывод сводки модели подходящими звуковыми эффектами, в зависимости от того, достигли ли вы магического уровня значимости p < 0.05 хотя бы для одной переменной (не считая интерцепта — ведь нам всё же стоит сохранять хоть какую-то разумность …).

devtools::install_github("bbolker/bbmisc/celebrate")
library(celebrate)

Чтобы эта штуковина сработала, на маке придется сделать

brew install sox

Насколько поняла, работает только с юниксоидами.

После этого делаете что-то такое:

m1 <- lm(speed~dist,cars)
m2 <- lm(Income~Population,data.frame(state.x77))
summary(m1)
summary(m2)

И вуаля 🎵🎵🎵

Можно установить произвольный уровень значимости:

options(celebrate.alpha = )

2.04.2025, 21:30

t.me/rantiquity/666

RA

RAntiquity

874 assinantes

12

2

248

Коллеги в комментариях в предыдущему посту написали, что неплохо бы и бинаризацию сделать для #ocr Попробовала, делюсь кодом и результатом.

31.03.2025, 19:09

t.me/rantiquity/665

RA

RAntiquity

874 assinantes

19

10

253

Последнее время приходится довольно много сканировать и распознавать, так что пришлось придумать небольшую хитрость, чтобы

✔️ разрезать разворот на два изображения
✔️ сшить pdf заново, но уже постранично

Всех дел на пару минут. После этого файл можно отдавать tesseract’у или нейросетям.

Хитрость на языке R доступна в виде gist’a, надеюсь будет полезна не только мне.

29.03.2025, 20:36

t.me/rantiquity/664

RA

RAntiquity

874 assinantes

24

2

251

Как написал сегодня по совсем другому поводу канал @atticist, “из колхозной молодежи панковал один лишь я”. https://t.me/parakharatteintonomisma/2097

29.03.2025, 20:23

t.me/rantiquity/663

RA

RAntiquity

874 assinantes

5

295

Слет антиварваров в РГГУ завтра на “Миусских античных посиделках”.

Совпадение? Не думаю.

p.s. программу прикрепляла выше

28.03.2025, 19:56

t.me/rantiquity/662

RA

RAntiquity

874 assinantes

Repostar

15

2

280

завтра иду рассказывать классикам на конфе в рггу, какой есть прикольный и простой цифровой инструмент для поиска аллюзий в латинских текстах

тем временем классики: еще в девяностых начали жаловаться, как компухтеры загубили комментаторскую работу

28.03.2025, 19:55

t.me/rantiquity/661

RA

RAntiquity

874 assinantes

31

1

262

Раньше были какие-то понятные преподавательские страхи. Забыть про собственную пару, не подготовиться и не знать, что делать со студентами полтора часа. Или, толком не проснувшись (по ночам мы же пишем статьи), примчаться с каким-то очевидным изъяном во внешнем виде. Ну всякое такое, скучища. Все это было и все это не страшно.

Предлагаю новый страх. Промахнуться мимо окошка в телеграме и случайно запостить в один из своих пабликов вопрос, предназначенный Chat AI Bot. И тогда весь мир узнает, что…

А что он узнает, кстати? Какие запросы реально могут смутить, если станут публичными?

Пишите в комментариях. Если написать, то не сбудется (тьфу-тьфу-тьфу). Гарантия 100% 🔮

25.03.2025, 18:59

t.me/rantiquity/660

RA

RAntiquity

874 assinantes

Repostar

9

1

169

Дорогие друзья, в ближайшую пятницу и субботу (28-29 марта) ищите антиварваров и их друзей в РГГУ на «Миусских античных посиделках», посвященных цифровым методам в изучении античности.

Программа и заказ пропусков по ссылке.

24.03.2025, 12:52

t.me/rantiquity/659

RA

RAntiquity

874 assinantes

7

5

234

Коллега прислала ссылку на CFP для цифровых философов, которых научная общественность продолжает искать днем с огнем. Я об этом, что могла, уже сказала и развивать не планирую, но вдруг кто-то думал в похожем направлении. Дедлайн в конце мая.

Regarding philosophy, however, there appears to be a striking under representation in the digital humanities sector so far. While there is some research done about philosophical aspects of digitalisation and even about methodological advantages of digital technology for philosophy, it is still rare in comparison with similar research in other disciplines.

This Collection aims to publish new philosophical views on digital knowledge infrastructures, particularly on the philosophical implications of the use of digital technology in research and education, e.g., machine-learning systems, linked open data applications, online archives, open access publication platforms, text analysis software, and perhaps even discipline-specific social media platforms like Phil-People. In addition, we want to emphasise the question how philosophy itself can make good use of this technology.

21.03.2025, 23:34

t.me/rantiquity/658

RA

RAntiquity

874 assinantes

53

11

326

Наконец-то кто-то сделал мем про меня. (6 часов — это довольно быстро, скорее 6 дней).

16.03.2025, 22:32

t.me/rantiquity/657

RA

RAntiquity

874 assinantes

13

4

274

Как проверить латинский текст на опечатки и ошибки распознавания с пакетами {hunspell} и {spelling}

Это решение подойдет для быстрой “очистки” после OCR. Код позволяет выбрать замену слова или скипнуть исправление в интерактивном режиме.

https://teletype.in/@locusclassicus/BBSaUFXR-1S

15.03.2025, 11:19

t.me/rantiquity/656

RA

RAntiquity

874 assinantes

17

4

283

В рубрике BEST DH TRAINING MATERIALS ищите вашу locusclassicus ☺️ http://dhawards.org/dhawards2024/voting/

Конкуренция серьезная, но хорошая новость в том, что можно голосовать в разных номинациях за разные проекты.

P.S. Расшары друзьям и знакомым кролика приветствуются! Правила конкурса это допускают

14.03.2025, 10:01

t.me/rantiquity/655

RA

RAntiquity

874 assinantes

1

http://dhawards.org/dhawards2024/voting/

14.03.2025, 09:55

t.me/rantiquity/654

RA

RAntiquity

874 assinantes

14

3

251

Кто-то должен был набраться смелости и задать наконец чату GPT самые острые вопросы современности.

1. Ограничения Xbox One:
Операционная система: Xbox One работает на базе Windows 10 Xbox Edition — специальной версии ОС с ограниченной функциональностью, которая не поддерживает установку стороннего ПО, включая RStudio Server.
Аппаратные ограничения: Xbox One не имеет GPU, совместимого с CUDA (требуется для ускорения нейросетей), а его процессор и память недостаточно производительны для серьёзных ML-задач.

В общем, развернуть безголовый сервер на приставке не получится. Даже если пройти финального босса 👻

13.03.2025, 12:24

t.me/rantiquity/653

RA

RAntiquity

874 assinantes

10

2

256

Осваиваю веселенький пакет FastTextR (снова неутомимый Эмиль Хвитфельдт!), позволяющий работать с предобученными эмбеддингами. Хочется, глядя на это, сказать голосом Любшина:

12.03.2025, 19:29

t.me/rantiquity/651

RA

RAntiquity

874 assinantes

14

1

279

Из особенных достижений за этот модуль, я считаю, вот. #цифровые_этюды #pca

12.03.2025, 09:40

t.me/rantiquity/650

RA

RAntiquity

874 assinantes

20

14

253

Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️

1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru. Бонус: код и данные для статьи «Танцы, эрос и зачатие: о чем писали “Платоновские исследования” за последние 10 лет». К статье есть видео прошлогоднего выступления на «Цифровой среде».

2) Кластеризация и метод главных компонент (текст, видео). Датасеты: на дом — сценарий сериала «Друзья» из пакета {friends} для кластеризации персонажей; аудиторная — датасет Galbraith из пакета {stylo} на определение авторства романа, написанного Роулинг под псевдонимом. И еще немного пингвинов из {palmerpenguins} для упражнения. Потому что пингвины лишними не бывают.

3) Стилометрический анализ с пакетом stylo (текст, видео). Датасет: древнегреческая литература, собранная автором для статьи «Delta Берроуза для древнегреческих авторов: опыт применения» (выборочно, ссылка на репозиторий). Также очень пригодились данные, опубликованные Даниилом Скоринкиным @fckndh. Даня, спасибо, особенно за Ильфа и Петрова!

4) Консенсусные деревья и сети (текст, видео). Аудиторная работа на том же Galbraith (он же Роулинг), домашняя — датасет Бориса Орехова «Стилеметрические данные “Тихого Дона” и современной ему прозы». Бонус: видео выступления на «Цифровой среде» с докладом «Лес за деревьями: филогенетические методы на службе платоноведения» (дискутант: Артем Юнусов из ИФЕ @philosophy_diary).

5) Сетевые данные в igraph (текст, видео). Датасеты из пакета {networkdata}, а также собранный Борисом Ореховым «Словарь русских писателей XVIII века: сеть персоналий».

6) Графический дизайн сетей с ggraph и visNetwork (текст, видео). Датасет: Тюдоры из пакета {historydata}.

7) Анализ сетей и обнаружение сообществ (текст, видео). Датасет: драматический корпус Dracor. На дом: сети Ходасевича (снова спасибо Борису Орехову) и сети «Войны и мира» (снова спасибо Даниилу Скоринкину).

Ссылка на весь видео-плейлист. Всего там 23 записи за этот учебный год.

🖥 Ссылка на репозиторий для issues и пул-реквестов.

Я уползаю готовиться к четвертому модулю, в планах добраться до многослойного перцептрона, но это уж как пойдет

12.03.2025, 09:36

t.me/rantiquity/649

RA

RAntiquity

874 assinantes

Repostar

10

3

202

В сети опубликована запись «Цифровой среды» с Ольгой Алиевой

🙂 Делимся новой записью онлайн-семинара Института цифровых гуманитарных исследований (DHRI) СФУ «Цифровая среда».

Кандидат филологических наук, доцент Школы философии и культурологии факультета гуманитарных наук НИУ ВШЭ и автор телеграм-канала RAntiquity Ольга Алиева рассказала об использовании филогенетических методов для определения авторства и хронологии платоновских текстов и поделилась важными итогами своего исследования.

Доклад «Лес за деревьями: филогенетические методы на службе платоноведения» будет интересен широкому кругу слушателей – тем, кто стремится по-новому взглянуть на исследования авторства и готов пересмотреть стереотипы, связанные со стилометрией.

Смотрим:

🔜 YouTube
🔜 Rutube
🔜 VK Видео

Здесь можно ознакомиться с перечнем всех выпусков «Цифровой среды» (гости семинара – исследователи-историки, филологи, лингвисты, культурологи, и не только).

#приоритет2030 #dhri #ицги #цифроваясреда #языкR #стилометрия

11.03.2025, 12:44

t.me/rantiquity/648

RA

RAntiquity

874 assinantes

28

4

262

Просто зафиксирую для истории тот день, когда GPT начал мной командовать. Раньше он все больше говорил "Рад был вам помочь" или "Могу ли еще что-то сделать?" А теперь сплошные императивы, и какие. "Отпишитесь" 😬

10.03.2025, 14:22

t.me/rantiquity/646

RA

RAntiquity

874 assinantes

2

238

9.03.2025, 19:02

t.me/rantiquity/645

RA

RAntiquity

874 assinantes

14

2

239

Как сделать так, чтобы RStudio «понимал» латынь

- Скачиваем https://latin-dict.github.io/docs/hunspell.html архив hunspell-la.zip и распаковываем его

- Находим на компьютере директорию со словарями:
• Linux and macOS: ~/.config/rstudio/dictionaries/languages-system/
• Windows: %AppData%\RStudio\dictionaries\languages-system\

- Добавляем туда два файла (с расширениями .dic и .aff) из архива

- После этого перезапускаем RStudio, идем в Tools — Global Options — Spelling, проверяем, что новый словарь доступен в списке словарей. Все, можно работать.

9.03.2025, 19:02

t.me/rantiquity/644

RA

RAntiquity

874 assinantes

27

21

539

Хорошая новость для тех, кому приходится распознавать тексты в дореформенной орфографии.

Борис Орехов опубликовал датасет, а Александра Горшенина написала под него код, позволяющий дообучать модели Tesseract для русского языка. За основу взят мастер-класс Андре Круса с примерами дообучения для распознавания математических символов.

Очень полезная в филологическом хозяйстве вещь! Спасибо коллегам.

9.03.2025, 13:13

t.me/rantiquity/643

RA

RAntiquity

874 assinantes

56

5

542

Вот такую чудесную мимозу подарили сегодня студенты. С радостью делюсь и желаю, чтобы всем нам удавалось, подобно мифическому Орфею, оживлять пением камни и данные. С праздником 🌼

8.03.2025, 13:29

t.me/rantiquity/642

RA

RAntiquity

874 assinantes

9

3

205

Гераклит называл Пифагора κοπίδων ἀρχηγός, “предводитель мошенников”, а всякий уважающий себя философ, как говорил Ямвлих, должен взять себе в руководители “родоначальника и отца божественной философии”.

Поэтому сегодня маленькая хитрость для тех, кто уже научился реферировать статьи с чатом GPT, но еще не придумал, как безболезненно скормить ему монографию. Для этого придется разрезать ее на главы, и самый простой способ это сделать в R — пакет {qpdf}

library(qpdf)

pdf_subset(input = “book.pdf",
output = "chapter.pdf",
pages = 10:20)

Дальше вы знаете что делать 🐳 Но, как показывает практика, надо хорошо подумать над промптом, т.е. по сути сначала прочесть источник, а потом уже задавать вопросы машине. Иначе получится обо всем и ни о чем.

6.03.2025, 14:33

t.me/rantiquity/641

RA

RAntiquity

874 assinantes

14

9

242

Сравниваем тексты с {diffobj}

ed1 <- "В начале было Слово, и Слово было у Бога, и Слово было Бог."
ed2 <- "Вначале было Слово, и Слово было к Богу, и Бог был Слово."

# Визуализация изменений
library(diffobj)
diffChr(ed1, ed2, mode = "sidebyside")

Ссылка на техническую документацию. Результат можно встраивать в markdown и shiny.

p.s. первая-то редакция получше будет

6.03.2025, 10:36

t.me/rantiquity/640

RA

RAntiquity

874 assinantes

15

3

286

Ну вот например. И это только публикации с вхождением “Платон” в названии, то есть лишь некоторая часть того, что о нем пишется.

5.03.2025, 22:42

t.me/rantiquity/639

RA

RAntiquity

874 assinantes

13

11

288

🔍 Как собрать датасет на основе библиографических данных Скопуса*

Понадобятся:
- API (https://dev.elsevier.com/),
- VPN
- пакет {rscopus} и обычный {tidyverse}

install.packages("rscopus")
library(rscopus)
library(tidyverse)

Sys.setenv(Elsevier_API = "0a0a0a0a0a0")
# проверяем
have_api_key()

Отправляем запрос. Я ищу по слову Plato в заголовке и предметной области ARTS. Уменьшите max_count или count, если функция капризничает.

res = scopus_search(query = "TITLE(Plato) AND SUBJAREA(ARTS)", max_count = 1000, count = 10, view = "STANDARD")

Тайдифицируем. Я забираю не все поля, посмотрите сами, что вам может быть интересно. Векторизованное переименование всех столбцов — разве это не красиво?

entries_df <- res$entries |>
gen_entries_to_df()

entries_df <- entries_df$df |>
select(`dc:title`, `dc:creator`,
`prism:publicationName`, `prism:coverDate`,
`subtypeDescription`) |>
rename_with(~ str_remove(., "^.*:"))

Повторить. Забрав первую сотню/тысячу описаний, можно использовать аргумент start = 1001 и т.п. Так вы начнете выгрузку со второй тысячи. Полученные датафреймы легко слепить воедино.

Исследовать. У меня получилось 5000 публикаций со словом Plato в заглавии, от 2025 до 1973 г. Что с ними делать, пока не решила. Может и не буду ничего делать 🤩 Публиковать датасеты Elsevier не разрешает, так что я просто сижу ищу друзей и знакомых

5.03.2025, 22:16

t.me/rantiquity/638

RA

RAntiquity

874 assinantes

28

5

336

Дорогие друзья, сегодня в 14-00 мск презентую итоги стилометрического исследования платоновского корпуса, которым я занималась последние несколько лет.

Это последняя статья в серии, которая, по моему замыслу, должна подвести некоторый итог всей работе. После этого, надеюсь, в моей жизни наступит сплошная метафизика.

Судя по рецензии, которую я на днях получила, поспорить сегодня будет о чем. Зарегистрироваться и подключиться можно по ссылке выше.

В согласии с принципами reproducible research делюсь репозиторием с данными, кодом, а также ссылкой на сегодняшнюю презентацию: https://github.com/locusclassicus/plato_new_model_2024

5.03.2025, 11:37

t.me/rantiquity/637

RA

RAntiquity

874 assinantes

22

256

одна алиева весны не делает, но надо же с чего-то начинать 😅

24.02.2025, 14:32

t.me/rantiquity/636

RA

RAntiquity

874 assinantes

Repostar

28

5

218

Весна все ближе: и мы готовимся к путешествию в «Лес за деревьями…» с уже знакомой постоянным участникам онлайн-семинара «Цифровая среда» Ольгой Алиевой.

Кандидат филологических наук, доцент Школы философии и культурологии Факультета гуманитарных наук НИУ ВШЭ, автор телеграм-канала RAntiquity («Об античности на языке R и не только») Ольга Валерьевна Алиева расскажет в своем докладе об особенностях методов консенсусных деревьев и сетей, их реализациях в программной среде R и результатах применения к анализу платоновского корпуса.

🔜 Присоединяйтесь к семинару в следующую среду.

Дата: 5 марта
Начало: 14.00 (мск)/ 18.00 (крск)
🔗 Зарегистрироваться и добавить в календарь здесь ←

#цифроваясреда #смотреть #слушать #платоноведение #языкR

24.02.2025, 14:32

t.me/rantiquity/635

RA

RAntiquity

874 assinantes

10

3

298

Между тем, февральское обновление в пакете {ellmer}: появились долгожданные функции content_pdf_file() and content_pdf_url(). Правда, пока их поддерживают не все модели, только Gemini & Claude. Будем ждать развития событий!

23.02.2025, 21:07

t.me/rantiquity/634

RA

RAntiquity

874 assinantes

16

5

262

Ютуб все понял про редактора этого канала и порекомендовал видео: НИЧЕГО НЕ ДАНО А НАДО. Красивая, кстати, задача, но лучше всего в ней название. Эпиграф к книге жизни.

22.02.2025, 20:08

t.me/rantiquity/633

RA

RAntiquity

874 assinantes

17

7

244

Как объяснить герменевтический круг аналитику данных

Герменевтический круг — это философская концепция, описывающая процесс понимания текста, явления или смысла, при котором целое интерпретируется через его части, а части – через целое. Это означает, что понимание любого отдельного элемента требует понимания контекста, а сам контекст, в свою очередь, формируется через понимание отдельных элементов.

Как правило, приступая к чтению текста, мы имеем очень отдаленное представление о «целом», и из этого несовершенного представления сооружаем такое же несовершенное понимание «частей», которое, однако, позволяет немного уточнить исходное «целое», а от него опять вернуться к «частям». Так мы двигаемся туда-сюда (или по кругу) очень долго, пока, наконец, все или почти все не складывается как надо.

Как понять, что это произошло? По-моему, так: каждая новая итерация уже не производит значительных смысловых сдвигов, плюс неземной свет.

А похоже это на алгоритм кластеризации. Сначала каждому наблюдению присваивается случайно выбранное число из интервала от 1 до K (число кластеров). Это исходные метки. Дальше вычисляется центроид для каждого из кластеров (это мы вернулись к «целому»). Центроид k-го класса – вектор из p средних значений признаков, описывающих наблюдения из этого кластера. Идем обратно к «частям»: каждому наблюдению присваивается метка того кластера, чей центроид находится ближе всего к этому наблюдению. Повторяем шаги 2-3 до тех пор, пока метки классов не перестанут изменяться.

А еще это похоже на градиентный спуск и постепенную минимизацию функции потерь, но эту метафору вы разверните сами. Правда, в искусстве интерпретации «алгоритму» бывает трудно остановиться, так что весь Google Scholar переполнен публикациями, которые уводят вас все дальше от наилучшего прочтения.

Осталось найти аналитика данных, которому это интересно.

20.02.2025, 20:26

t.me/rantiquity/632

RA

RAntiquity

874 assinantes

26

6

258

Студенты прислали валентинку, сделанную в {ggplot}. А вот и источник! Невероятно трогательно, спасибо 🥰🥰🥰

14.02.2025, 11:33

t.me/rantiquity/631

RA

RAntiquity

874 assinantes

24

5

232

valentine.gif.mp4

14.02.2025, 11:31

t.me/rantiquity/630

RA

RAntiquity

874 assinantes

22

8

282

Кажется, знаешь человека давно, уже и Цицерона вместе читали, и Цезаря, и Лукреция, и даже немного Августина — и тут выясняется, что этот человек опубликовал огненный лонгрид на “Системном блоке” про цифровые просопографии и графовые модели в изучении античности. https://t.me/antibarbari/3006

Тут и методология исторической науки, и реляционные БД, и несколько фирменных шуток от @patroclusisnotdead Просто именины сердца, Ксюша, поздравляю!

13.02.2025, 18:13

t.me/rantiquity/629

RA

RAntiquity

874 assinantes

8

4

197

Кстати, на сайте есть ссылка на другой проект https://exiledempiricists.wordpress.com/ Который подтверждает мой недавний тезис о том, что цифровая история философии возможна скорее как социология философии, чем как и-ф. в традиционном смысле слова. Сайт красивый, перевод даю автоматический

«Изгнанные эмпиристы» – это пятилетний исследовательский проект, финансируемый Европейским исследовательским советом (ERC) и Нидерландским исследовательским советом (NWO). Проект возглавляет Сандер Верхаэг и он реализуется на базе Тилбургского центра моральной философии, эпистемологии и философии науки (TiLPS) Тилбургского университета.

11.02.2025, 19:55

t.me/rantiquity/628

RA

RAntiquity

874 assinantes

7

4

214

В копилку инструментов и методов цифровой истории философии: https://t.me/Philosophytoday/15267 Снова сети. Эyхенио Петрович, один их хедлайнеров проекта, благодаря @curiousonya уже некоторое время в поле моего зрения, в 2022 г. у него была любопытная статья о сетях благодарностей, о которой см. https://t.me/curiousonya/217 А вот ссылка на сам проект: https://edhiphy.org/network Очень милое онлайн-приложение. Молодцы, чо.

11.02.2025, 19:48

t.me/rantiquity/627

RA

RAntiquity

874 assinantes

1

А только у меня Stackoverflow вот так выглядит (любой вопрос, с впн или без) ?

7.02.2025, 06:36

t.me/rantiquity/626

RA

RAntiquity

874 assinantes

9

1

256

Латинский гиперкуб — обобщение латинского квадрата Эйлера на произвольное число измерений. Используется для поиска оптимальных параметров в МО. А латинским называется потому, что Эйлер (про которого недавно писал дружественный канал) использовал латинские буквы. Пакет {dials} версии 1.3.0 отказался от такого названия функции, а жаль. Так в нашей жизни стало еще меньше латыни.

Вообще в МО есть множество _просто красивых_ вещей, прекрасных самих по себе, а не ради пресловутого скоринга.

5.02.2025, 12:16

t.me/rantiquity/625

RA

RAntiquity

874 assinantes

57

2

310

Недавно пришли отзывы студентов на первую часть курса “Компьютерный анализ текста” #tar2024 , общая оценка 4.93 из 5, мой личный рекорд.

Очень приятно, что курс приносит удовлетворение не только мне — и, конечно, такие отзывы вдохновляют и заставляют стремиться к большему.

На облаке слов — основные биграмы из отзывов. Спасибо 🤗

2.02.2025, 12:14

t.me/rantiquity/624

RA

RAntiquity

874 assinantes

12

5

300

Что ни говори, а инфраструктура под недружественные интеллекты очень дружественная, и для тех, кому машина нужна не под капотом возиться, а ехать, Хадли делает классные продукты.

Его {ellmer} позволяет без особых усилий извлекать структурированные данные из изображений. Что это такое — решайте сами; в моем случае — распознанный текст и перевод. OpenAI: распознавание на 5, перевод на русский на 3+.

Записывайте: перечислить файлы, придумать тип данных для выхода, запустить чат. На выходе таблица: в одном столбце текст, в другом — перевод.

library(ellmer)
library(tidyverse)

# придумываем, какие нужны столбцы

type_text <- type_object(
"Latin text and Russian translation of the text. Occasionally, you might see some Ancient Greek.",
text = type_string("Latin text"),
translation = type_string("Russian translation")
)

# список изображений
my_images <- list.files(pattern = "png")

# рабочая функция для purrr
process_image <- function(image_path) {
response <- chat$extract_data(
content_image_file(image_path),
type = type_text
)
return(response)
}

# еще спроси, а где здесь вожжи
all_responses <- map_dfr(my_images, process_image)

В промышленных масштабах пока не пробовала.

2.02.2025, 00:18

t.me/rantiquity/623

RA

RAntiquity

874 assinantes

2

1

47

Что ни говори, а инфраструктура под недружественные интеллекты очень дружественная, и для тех, кому машина нужна не под капотом лежать, а ехать, Хадли делает классные продукты.

Его {ellmer} позволяет без особых усилий извлекать структурированные данные из изображений. Что это такое — решайте сами; в моем случае — распознанный текст и перевод. OpenAI: распознавание на 5, перевод на русский на 3+.

Записывайте: перечислить файлы, придумать тип данных для выхода, запустить чат. На выходе таблица: в одном столбце текст, в другом — перевод.

library(ellmer)
library(tidyverse)

# придумываем, какие нужны столбцы

type_text <- type_object(
"Latin text and Russian translation of the text. Occasionally, you might see some Ancient Greek.",
text = type_string("Latin text"),
translation = type_string("Russian translation")
)

# список изображений
my_images <- list.files(pattern = "png")

# рабочая функция для purrr
process_image <- function(image_path) {
response <- chat$extract_data(
content_image_file(image_path),
type = type_text
)
return(response)
}

# еще спроси, а где здесь вожжи
all_responses <- map_dfr(my_images, process_image)

В промышленных масштабах пока не пробовала.

2.02.2025, 00:07

t.me/rantiquity/622

RA

RAntiquity

874 assinantes

Repostar

6

9

255

📌 Классифицируем отзывы сотрудников о работодателе с помощью R, rollama и Ollama

В предыдущем посте мы научились устанавливать и пользоваться LLM локально. Теперь знакомимся с практическим примером.

@people_analytics

#LLM #БЯМ #AI #R #people_analytics #отзывы_сотрудников

1.02.2025, 01:52

t.me/rantiquity/621

RA

RAntiquity

874 assinantes

46

10

288

доцент алиева гоняется за llm с вопросом об эпиграмматической соли

30.01.2025, 14:14

t.me/rantiquity/620

RA

RAntiquity

874 assinantes

2

274

Вот тут кстати на SO инциировала обсуждение, как подключиться к API дипсика из среды R. Все работает, если дать денег (существенно меньше, чем просит OpenAI). Надо будет еще подумать, чтобы как в {ellmer} сразу структурированные данные извлекать, но это все позже, сейчас завал.

Может пока я буду думать, китайцы уже пакет напишут. Тогда и с ВПН можно было бы не мучиться (все, что работает через ВПН, практически невозможно демонстрировать в реальном времени на паре, например).

29.01.2025, 10:09

t.me/rantiquity/619

RA

RAntiquity

874 assinantes

23

20

330

Задала Яндекс жпт и Дипсику (о котором уже писала) один несложный вопрос по школьной программе: что Гончаров имеет в виду, когда в “Мильоне терзаний” говорит об “эпиграмматической соли” комедии “Горе от Ума”? Оба раза спрашивала по-русски. Ответ Дипсика в скриншот не влезает, поэтому цитатой (только итог, без “размышлений”):

Эпиграмматическая соль языка в оценке Ивана Гончарова по отношению к Александру Грибоедову — это характеристика остроумия, ёмкости и сатирической выразительности, присущей языку Грибоедова, особенно в его комедии «Горе от ума».
Контекст и значение:

Эпиграмматичность отсылает к краткости и остроте, свойственным эпиграмме — жанру лаконичной, язвительной поэзии.

«Соль» в данном случае метафорически означает остроту, «приправу» сатиры, которая оживляет текст, делая его ярким и запоминающимся.

Применение к Грибоедову:

Гончаров, анализируя «Горе от ума», отмечал, что язык персонажей пьесы насыщен афоризмами и остротами, которые стали крылатыми выражениями («Счастливые часов не наблюдают», «Служить бы рад, прислуживаться тошно»).

Эти фразы сочетают в себе иронию, сарказм и глубокий социальный подтекст, что и составляет «эпиграмматическую соль». Они не только характеризуют героев, но и критикуют пороки общества.

Почему это важно:

Гончаров подчеркивал, что Грибоедов мастерски использовал язык как инструмент сатиры, превращая диалоги в оружие против косности дворянства и лицемерия светских норм. «Эпиграмматическая соль» стала ключевым элементом новаторства Грибоедова, повлиявшим на развитие русской драматургии и литературы в целом.

Таким образом, это выражение отражает способность Грибоедова создавать текст, где каждая фраза — не просто реплика, а законченное высказывание, заряженное смыслом и критической энергией.

Ответ не имеющего аналогов в мире Яндекс-ЖПТ 4 на скриншоте.

29.01.2025, 09:29

t.me/rantiquity/618

RA

RAntiquity

874 assinantes

13

2

243

винтажные диаграммы + коты = DH здорового человека

26.01.2025, 21:32

t.me/rantiquity/617

RA

RAntiquity

874 assinantes

Repostar

6

248

874 assinantes

Repostar

18

6

235

Сколько кошек было у Колетт?

🔘🔘🔘

В 1989 году Этьен Брюне опубликовал статью, где решил пересчитать животных во французской литературе 19-20 веков. Это стало возможно благодаря созданию Цифрового тезауруса французского языка (TLFi), который на тот момент насчитывал 2 500 текстов (по современным меркам, конечно, не очень много).

В качестве центрального автора Брюне выбрал Колетт, полагая, что её любовь к животным находит отражение и в её текстах. При помощи программы STELLA (которая визуализирует расчёты) Брюне анализирует частоту встречаемости животных в пяти произведениях Колетт, сравнивая их с текстами других французских авторов (среди них — Бовуар, Камю, Пруст и Селин):

⏪Мы предлагаем проверить, любит ли Колетт кошек или животных вообще [...] Вряд ли Колетт питала любовь к измерениям и подсчетам. Считать монетки это ещё куда ни шло. Но считать слова вместо того, чтобы их взвешивать! Считать животных вместо того, чтобы их гладить! Без сомнения, этот безумный проект никогда не приходил Колетт в голову — даже в те беспокойные вечера, когда счет овец, как говорят, помогал ей уснуть. Но чтобы успокоить Колетт и избавить её призрак от кошмара цифр, мы не покажем вам процесс их приготовления [la cuisine des chiffres ne sera pas montrée]. Достаточно знать, что эти кривые получаются в результате перекрестного умножения, квадратных корней и многих других ингредиентов, одни названия которых могут испортить вам аппетит, хотя компьютер переварит их без проблем.⏩

В ходе цифровой кулинарии выясняется, что чаще всего Колетт пишет про кошек (chat / chatte) — что особенно, по мнению Брюне, выделяет её на фоне других авторов, которые либо не особенно обращаются к животным в своих текстах, либо используют их в символическом значении. Или как пишет Брюне в заключении:

⏪В этом случае статистика лишь подтверждает ощущение очевидного. Это, конечно же, не является открытием, и мы добились лишь относительного прогресса в доказательстве, если не правильности [количественного] метода, то хотя бы того, что он не является ошибочным.⏩

А кошек у Колетт насчитали 198 🙂

26.01.2025, 21:28

t.me/rantiquity/615

RA

RAntiquity

874 assinantes

Repostar

266

наконец-то опубликовали текст секретного древнегреческого дневника парижского эллиниста девятнадцатого века!!! с трепетом ожидала этого события, от души поздравляю команду проекта LAGOOS и бегу читать, как Хазе ходил в библиотеку, на лекции и по гостям

25.01.2025, 06:57

t.me/rantiquity/614