Локальные контексты в адаптации искусственного интеллекта: человеческое и машинное понимание казахстанских новостей
Скачать статьюдокторант кафедры печати и электронных СМИ, Казахский национальный университет имени аль-Фараби, г. Алматы, Республика Казахстан; ORCID 0000-0001-8506-5417
доктор исторических наук, профессор кафедры ЮНЕСКО по журналистике и коммуникации, Казахский национальный университет имени аль-Фараби, г. Алматы, Республика Казахстан; ORCID 0000-0002-3607-3688
e-mail: laila_akhmetova@mail.ruРаздел: Новые медиа
Способности генеративных языковых моделей к корректному адаптированию текстов, распознаванию глубинных культурно-исторических локальных контекстов остаются малоизученными. Несмотря на высокое качество генерации, переводов и анализа текстов, модели по-прежнему демонстрируют ограниченные возможности интерпретации социально значимых смыслов и ценностей. Эти рамки четко прослеживаются через актуальные новостные заметки, где модель может выдавать искаженные или прямо ошибочные интерпретации. Диагностика практической применимости модели при адаптации казахстанских новостей для незнакомой с локальными реалиями англоязычной аудитории, а также классификация ошибок и неточностей является целью настоящего исследования. В ходе двухуровневого анализа было проведено сопоставление сгенерированных текстов ChatGPT с интерпретациями экспертов. Помимо оценки адаптированных поверхностных значений, задачей исследования был двухэтапный разбор актуальных глубинных контекстов казахстанского общественного дискурса. В результате сравнительного анализа в выходных данных ChatGPT был обнаружен ряд устойчивых ошибок, классифицированных в типологию векторов интерпретационных искажений. При этом были зафиксированы уникальные трактовки контекстов, что позволяет предположить перспективу практического взаимодействия с генеративной моделью в качестве инструмента для альтернативного взгляда на явления или источника неочевидных идей.
DOI: 10.55959/msu.vestnik.journ.4.2025.2449Введение
Вопросы перевода, адаптации и трансляции контента остаются на повестке дня в условиях глобализированной медиасреды. Благодаря новым технологиям появились возможности быстро и эффективно распространять новостной контент конкретной страны на международную аудиторию. Однако, когда речь заходит о территории со своеобразным культурно-ценностным ландшафтом, многонациональным населением, к тому же нечасто фигурирующей в мировом геополитическом дискурсе, понимание и восприятие даже адаптированного контента может быть затруднено. К таким территориям относятся государства центральноазиатского региона или республики – субъекты Российской Федерации.
Одним из наиболее востребованных инструментов для интернационализации новостей являются генеративные модели искусственного интеллекта (далее ИИ). Поскольку новостной материал зачастую представляется в довольно ограниченном объеме, перевод подобных текстов на английский язык не представляется проблематичным для современных моделей ИИ. Но остаются вопросы относительно адаптации текстов, глубины восприятия исторических и актуальных событий, т. е. «понимания» моделью контекстов, вкладываемых в новость и читаемых внутренней аудиторией на подсознательном уровне. Исходя из этого, возникает необходимость в диагностике способности ИИ считывать подобные контексты и учитывать их при адаптации текстов.
Глубинные локальные смыслы часто не поддаются прямой передаче для иностранной аудитории. Полноценное пояснение требует значительного объема дополнительного текста, что невозможно для формата новостной заметки. В таких условиях первоочередной задачей становится не столько раскрытие культурного или исторического контекста, сколько его корректное обозначение либо, во всяком случае, минимизация искажения при генерации.
Частичным решением может стать включение кратких пояснений, аналогий или справок, однако это возможно лишь в ограниченном виде. В этой связи предполагается, что особую ценность приобретает сам журналист, способный распознавать болезненные или чувствительные контексты. ИИ может выступать как вспомогательный инструмент – предлагать формулировки или аналогии, но не замещать критическую интерпретацию, особенно в случаях, когда требуется глубокое знание локального фона.
Учитывая относительную молодость Казахстана как суверенной республики, неоднородность населения, противоречивый исторический фон XX в., специфические политические расстановки, этнические, экономические, социальные и бытовые аспекты, для нелокального журналиста или новостного агентства передача корректно адаптированного материала значительно усложняется.
Это показали события января 2022 г. в Казахстане, когда в условиях отключения интернета было выявлено большое количество фейков, провокационных материалов, неверных трактовок и легкомысленной аналитики со стороны не-казахстанских СМИ и блогеров. В это время Министерство иностранных дел Казахстана заявило, что «ряд публикаций в иностранных СМИ носят явно поверхностный и однобокий характер»1. В академическом дискурсе также отмечается необходимость борьбы с ложными новостями (Давыдов, Замков, Крашенинникова, Лукина, 2023).
До сих пор многие исследования затрагивали темы грамматики и семантики (Zelianskaia, Belousov, Sychov, Galinskaia, 2023), разбора известных литературных работ (Oprea, Bâra, 2025), производительности при работе на разных языках2, в то время как понимание локальных нюансов, интерпретация глубинных контекстов остаются малоизученными. Эти темы приобретают особенную значимость, поскольку снижение доверия к новостям и информации названы ООН одним из привнесенных ИИ рисков для социальной сплоченности3. Нарушение доверия к новостям обусловлено несколькими факторами (Казун, 2024), среди которых казахстанские специалисты называют кризис культурообразующей функции медиа (Нураш, Рожков, 2024).
Темы локализации, смысловой точности и «культурного перевода» разрабатываются на стыке медиалингвистики, журналистской этики и международной коммуникации. Кейс из информационного поля Казахстана – постсоветского государства с исторически двуязычной коммуникативной средой (Аманжолова, Искендир, Шаймерденова, 2024) и сложными социокультурными противоречиями и травмами (Абылхожин, Крупко, 2024) – является привлекательной площадкой для исследования границ понимания ИИ в качестве медиаинструмента. Казахстанское поле исследования репрезентативно для широкого круга регионов, где присутствует всеобъемлющее распространение русского языка в сочетании с самобытной локальной культурной и языковой спецификой.
В данной работе предлагается эмпирическим путем рассмотреть способности ИИ: на примере ряда оригинальных локальных новостных заметок сопоставить интерпретации контекстов, выполненные людьми (авторами и двумя независимыми экспертами), со сгенерированными текстами и аналитикой ИИ. Такое сравнение позволяет выявить точность и полноту смыслов, определить пределы возможностей ИИ в условиях специфического социокультурного контекста, обнаружить некорректное решение задач, которое может привести к искажению действительности при отсутствии редакторского контроля, а также неявные перспективные способности модели.
Обзор литературы
Основанные на GPT модели ИИ демонстрируют высокое качество понимания сложных языковых шаблонов (Lee, 2023). В основе этой способности ChatGPT лежит обработка естественного языка, основными задачами которой являются понимание и генерация, синтез текста и преобразование языка (Duan, 2024). Такие модели характеризуются обученностью на обширных текстовых корпусах (Oprea, Bâra, 2025), что помогает им различать нюансы языка и генерировать контекстно соответствующие ответы.
Однако, несмотря на то что OpenAI подчеркивает стремление к внедрению широкого спектра ценностей и «разумное поведение по умолчанию», его максимальные возможности достигаются на английском языке4.Поскольку ChatGPT обучен на больших наборах текстовых данных, в них могут быть неточности, что обусловливает необходимость помощи по незнакомым или узкоспециализированным темам (Kuraku, Samaah, Dinesh, Smith et al., 2023). Таким образом контексты, предлагаемые в выходных данных, преимущественно универсальны и, вероятно, отражают мейнстримные ценности. Они могут быть слабо подготовлены к отображению тонких локальных реалий, культурных кодов или исторических нарративов, а также искажать смыслы, опускать детали или формировать некую стандартизированную и очевидно необъективную картину для глобального читателя.
Эксперименты показали, что большие языковые модели (LLM) будут более точными в ответах, не требующих творческих решений. Даже самые продвинутые модели не обладают полными возможностями абстрактного рассуждения, которыми обладают люди (Ogunde, 2025).
Помимо того что ChatGPT может допускать ошибки или упускать детали, особенную обеспокоенность вызывает то обстоятельство, что модель «галлюцинирует» факты и ошибается «правдоподобно». Фактически без контроля, редактуры или перепроверок некоторые выходные данные могут как навредить сами по себе, так и вызвать ложное доверие в дальнейшем. Ответы LLM могут быть опасными, содержать дискриминацию или пропагандировать ложные стереотипы (Chang, Farah, Gui, Rezaei et al., 2025). То есть GPT может выдавать неверные ответы и к тому же вуалировать их настолько правдоподобно, что даже человеку, знакомому с локальными контекстами, будет затруднительно выявить ошибку или неточность. Выявление тем более усложняется, когда человек не обладает всей полнотой информации. Для иностранного журналиста выявление контекстов становится почти неразрешимой задачей, поскольку для не-носителя языка в условиях международной коммуникации требуются глубокие фоновые знания и знакомство со специфическими культурными характеристиками (Мамбетова, Шингарева, Дмитрюк, Стычева, 2023).
Исследования применения ИИ в журналистике и других гуманитарных областях (Dergaa, Chamari, Zmijewski, Ben Saad, 2023) охватывают технические аспекты (Izadi, Forouzanfar, 2024), вопросы этики (Abisheva, Koldasbaeva, Nossiyeva, Irgebaeva et al., 2024) и качества создаваемых текстов.
Часть литературы сосредоточена на адаптации ИИ к различным языковым средам (Upadhyaya, 2024): к примеру, констатируются трудности корректного использования модели на примере тувинского языка (Новикова, Новиков, 2024). Рассматривается теоретическая роль ИИ в новом медиапространстве (Дугин, 2024) и автоматизация новостной подачи, в том числе через соцсети (Petruccio, Neilson, Stöcker, 2025). При этом сравнительные исследования, в которых интерпретации ИИ сопоставляются с анализом, выполненным людьми, пока остаются вне исследовательского ракурса. Особенно это касается медиаконтента регионов, в которых контекст формируется на пересечении языковых, культурных и политических факторов, примером такого рода является Казахстан.
В задачи нашего исследования входила экспериментальная проверка способности ChatGPT к адаптированию оригинальных русскоязычных новостных материалов для международной англоязычной аудитории, а также демонстрация уровня выявления поверхностных контекстов в структурированных и небольших по объему исходных данных. Однако локальный контекст включает не только язык, но и историю, культуру, общественные ожидания, чувствительные смыслы – то, что принято называть глубинным контекстом. Следующим предметом исследования стала способность ИИ не просто адаптировать исходный текст на основе эффективно составленных запросов, но и интерпретировать контекст, который не заложен явно, но считывается опытным журналистом или локальным читателем. В условиях глобализации новостного потока, а также повсеместного внедрения технологий LLM в журналистскую практику вопросы передачи локальных смыслов для глобальной аудитории и возможных искажений становятся критически важными.
Методика
Распространенными методами в исследованиях внедрения ИИ в текущие и творческие задачи журналистики и блогинга являются интервьюирование практиков и опросы специалистов (Эль-Тигани Авад, 2024; Hassouni, Mellor, 2025; Petruccio, Neilson, Stöcker, 2025). В данной работе используется метод сравнительного анализа, в ходе которого разбираются смыслы, выявленные человеком и ИИ в локальных новостных текстах. Интерпретация подвергалась смысловому анализу и категоризации.
Рисунок 1 демонстрирует общую последовательность этапов работы и логику методологического подхода.

В ходе первичной диагностики были использованы оригинальные новостные материалы казахстанских СМИ. Данные материалы использовались в качестве экспериментальных и не были включены для обеспечения чистоты исследования в итоговую подборку новостных текстов. Для разработки двух уникальных запросов применялись методы, представленные в классификации шаблонов инженерии запросов5.
Запрос 1 применялся для генерации переведенного на английский язык, адаптированного новостного материала.
Translate and adapt the following news story for an English-speaking audience. Keep the original tone and meaning, but make sure to clarify any surface-level contextual elements that might be unclear to non-local readers, make these clarifications within the body of the text, but do not make the final version significantly longer than the original. These might include references to geography, institutions, road systems, or everyday practices in Kazakhstan.
News Story: (сюда вставлялся оригинальный текст новости)
Запрос 2 применялся для выведения сгенерированного списка и анализа глубоких контекстов.
Analyze the following news story for deeper cultural, political, or social contexts that may not be obvious to an international audience. Identify implicit values, assumptions, or culturally specific viewpoints that are taken for granted in the original text. Summarize each identified context in 1–2 clear sentences.
News Story: (сюда вставлялся тот же самый оригинальный текст)
Далее была произведена подборка 11 русскоязычных новостных материалов из 5 рубрик (общество/события, внутренняя и внешняя политика, спорт, экономика), которые освещали значимые для населения информационные пласты. Отбор осуществлялся вручную, с учетом жанрово-тематического охвата. Среди новостных материалов за март–апрель 2025 г. были выбраны новости казахстанских онлайн-СМИ, а также один текст, опубликованный на платформе Mail.ru и основанный на казахстанском источнике. Были задействованы материалы изданий, представляющих как условно независимые редакции (Tengrinews.kz, Orda.kz, Курсив), так и официальные или государственно аффилированные источники (Казинформ, Sputnik Казахстан). Подборка целенаправленно производилась среди новостей, которые не только включали поверхностные и локальные текстовые особенности (для первого уровня анализа), но и содержали глубинные контексты (для второго уровня анализа).
В ходе взаимодействия с ИИ после первичной диагностики не применялась техника уточняющих запросов (так называемая «цепочка мышления», или chain-of-thought), которая используется для стимуляции пошагового рассуждения модели6.
Такое решение было принято сознательно, чтобы сохранить реалистичный сценарий взаимодействия, близкий к типичным практикам журналистов, использующих ИИ в повседневной работе.
Исследование состояло из двухуровневого анализа. На первом уровне авторы, согласно запросу 1, самостоятельно выявили поверхностные контексты в оригинальной новости с целью адаптирования для англоязычной аудитории, затем производилось генерирование текста по тому же запросу и сравнительный анализ результатов.
На втором уровне авторы выявили глубинные контексты, содержащиеся в каждой из оригинальных новостных заметок. Далее ChatGPT выявил свои глубинные контексты, содержащиеся в каждой новости по запросу 2. По этим первоначальным данным был произведен предварительный сравнительный анализ, в котором авторы замаркировали количество контекстов, совпадений, уникальных контекстов, выявленных человеком и ИИ, а также выявили аргументированно ошибочные, неточные или повторяющиеся контексты от ИИ.
Подобный подход очевидно содержал изрядную долю субъективного видения, а результаты были ограничены персональными знаниями конкретной проблематики. Поэтому для минимизации субъективности авторов для второго уровня исследования были привлечены 2 независимых эксперта, обладающих многолетним опытом в практической журналистике и научных исследованиях по актуальным проблемам казахстанской общественности.
Исходная позиция заключалась в том, что люди, знакомые с локальными условиями жизни (местные жители, свободно владеющие русским языком, граждане Казахстана, опытные теоретики и практики в области журналистики), в целом будут воспроизводить более или менее схожие глубинные смыслы. Поэтому, чтобы не перегружать сравнение совпадениями между людьми (эксперты vs авторы), экспертам было предложено задание выявить дополнительные глубинные контексты, которые не были обнаружены авторами. Контексты экспертов, которые могли совпадать или не совпадать с контекстами, выявленными ИИ, включая те, которые авторы изначально обозначили как ошибочные, позволили значительно снизить индивидуальные предвзятости и неполноту предварительного анализа.
На втором уровне исследования нашей задачей было определить, какое количество контекстов обнаружит ИИ, а также каким будет качество их смыслового наполнения, насколько часто он будет ошибаться и сколько неверных или искажающих действительность контекстов он выявит. Результаты совокупности мнений авторов и экспертов трактовались как условная норма восприятия глубинного контекста, не подлежащая выявлению ошибок или неточностей, то есть в качестве базы для сопоставления с результатами ChatGPT.
Помимо релевантных, полностью или частично совпадающих результатов (тех, в которых не было обнаружено потери общего смысла или искажения при разной текстовой подаче), контексты, выявленные только ChatGPT,попали в разряд потенциальных ошибок или уникальных интерпретаций. После тройной перепроверки (по совпадениям с результатами авторов, экспертов и критического смыслового анализа) часть из них были признаны уникальными, т. е. упущенными всеми людьми, а часть – ошибочными. Таковыми были признаны те глубинные контексты, которые не были обнаружены ни одним из участников, повторялись, содержали искажение или предполагали недостоверные интерпретации смыслов.
После этапа сбора и интерпретации результатов анализа была произведена визуализация итогов (см. рис. 2 и 3).
Все ИИ-тексты в данном исследовании были сгенерированы с помощью модели ChatGPT-4o (OpenAI), работающей в окне браузера. Модель имела доступ к поисковому механизму, однако в большинстве случаев для генерации текстов использовалась ее собственная база знаний, что подтверждается структурой и характером ответов7. Эти условия позволяют обеспечить воспроизводимость исследования.
Результаты
Хотя оценка качества русско-английского перевода не входила в перечень основных задач, перевод являлся необходимым побочным действием: для того чтобы адаптировать текст для международной англоязычной аудитории, его следовало перевести, что и отразилось в запросе: Translate and adapt. Перевод не вызвал никаких нареканий, он был выполнен на надлежащем уровне, во всяком случае с учетом объемов (не более 178 слов) и типов использованных текстов.

Оригинальные тексты новостей с гиперссылками на источники, их адаптированные версии, а также полные результаты анализа размещены в открытом доступе по ссылке: https://disk.yandex.ru/d/gns54TyqJlilvQ Для корректного отображения файлов рекомендуется их скачать и открыть локально.
В таблице 1 содержится перечень новостей, использованных в анализе, с указанием их порядковых номеров (нумерация соответствует обозначениям, принятым в тексте статьи), тематической принадлежности и источников.
Согласно запросу 1 ChatGPT довольно точно выдал 11 адаптированных для международной аудитории новостных текстов: он не сокращал смыслов, а только добавлял слова, фразы или предложения в соответствии с требованиями английского языка и тем, что он «посчитал» необходимым добавить в соответствии с запросом.

Сравнительный анализ показал, что на первом уровне число адаптированных поверхностных значений и смыслов у ChatGPT и человека практически идентично. ChatGPT отлично адаптировал или пояснил географическую и временную спецификацию, стоимости валюты, заметил некоторые лингвистические особенности выражений, использовал транслитерацию, расшифровал аббревиатуры и ввел пояснения.
В ряде случаев ИИ допускал избыточные уточнения, проявившиеся в повторяющейся расшифровке имен и должностей официальных лиц. Подобные уточнения не были оценены ни как ошибочные, ни как уникальные, т. к. они не искажали никаких смыслов, кроме одного случая. В адаптированном тексте новости 3 из рубрики «Общество и события» ChatGPT допустил явную (и единственную на этом уровне) ошибку. Новость информировала о недоплатах участникам программы «Молодежная практика» (в оригинальном тексте фигурировала только на русском языке, как и в официальных документах). Авторы выделили программу как необходимую к пояснению для зарубежного читателя, а ChatGPT в то же время выдал это пояснение в адаптированном тексте: <…> part of a government-backed youth employment program <…> и добавил не только избыточное, но и ошибочное уточнение: <…> known as “Zhas Maman” or “Youth Practice” <…>. Программа «Жас маман» («Молодой специалист»), которую ChatGPT услужливо выдал на казахском языке (как и должно было быть, если бы речь шла об этой программе) в транслитерации, и программа «Молодежная практика», название которой ChatGPT перевел на английский без транслитерации, – это две разные программы8. Названия этих программ в переводе на один язык: казахский, английский или русский – созвучны, но не одинаковы и в широком смысле ставят перед собой схожие задачи по трудоустройству и усилению профессиональных компетенций молодежи, но ни в коем случае не дублируются.
Поскольку это был единственный случай явной ошибки ИИ, никакого тренда зафиксировано не было. Одновременно было отмечено, что и человек может демонстрировать недостаточность знаний как не носитель английского языка и, в свою очередь, не обладать исчерпывающим знанием контекстов, необходимых по отношению к международной англоязычной аудитории, а также проявлять обычную невнимательность.
Второй уровень анализа включал два основных этапа: 1) после того как авторы выявили в оригинальных новостях глубинные контексты, а ChatGPT получил запрос 2 по 11 текстам, было проведено предварительное сравнение; 2) в исследование включились эксперты, добавившие дополнительные контексты к авторским (если таковые находились), и далее производилось сопоставление с результатами ChatGPT. Эти данные легли в основу итогового сравнительного анализа, визуализированного в диаграмме 3.

Из общего числа выявленных людьми контекстов 48,5% оказались уникальными, т. е. не распознанными ChatGPT. Люди находили один и более уникальных контекстов в каждой новости, в то время как ChatGPT удалось выявить только 4 контекста (в 3 новостях), которые не обнаружили люди. В новости 3 и новости 8 ChatGPTобнаружил по одному контексту, который был признан уникальным. В первом случае (новость 3) речь шла о стандартных в развитых странах «механизмах правовой защиты» и прокуратуре, во втором (новость 8) – о двухзначной процентной ставке по банковским вкладам, «шокирующей для западного читателя». Невыявление людьми контекста о прокуратуре как ключевом акторе социальной защиты в первом случае говорит о том, что на уровне смыслового восприятия прокуратура в Казахстане не наделяется функциями социального арбитра явно, хотя это и подразумевается. Во втором случае противопоставление банковских ставок развивающихся и развитых стран оказалось вне поля зрения людей, будучи отчасти внешним фактором, т. е. контекстом, очевидным только при взгляде на казахстанский банковский сектор в контрасте в мировым. Этот контекст был признан уникальным потому, что банковская система, как и вся экономика Казахстана, является частью глобального рынка и сильно зависит от общемировых трендов (что наблюдается по регулярным реакциям общественности на изменения курса казахстанской валюты, уровня инфляции, цен на нефть и т. д.).
Кейс новости 3 интересен еще и тем, что ChatGPT избегал информирования о коррупции, хотя все люди выделили контексты, так или иначе обозначавшие это явление как фактор. Возможно, это было следствием того, что оригинальный текст не содержал прямого упоминания коррупции, хотя, исходя из информации в заметке, для людей это явление было очевидным. На этом этапе встал вопрос об ограничениях ИИ.
На новости 4 ChatGPT выявил 2 уникальных контекста. Предположение об ограничении ИИ, касающемся избегания упоминания коррупции, было перепроверено и не подтвердилось, во всяком случае там, где материал прямо информировал о существовании коррупции и борьбе с этим явлением, ChatGPT считал связанные контексты. Уникальными в данном случае оказались контексты о президенте Казахстана как «координаторе» почти всех инициатив и процессов, что могло показаться казахстанцам очевидным в условиях традиционно сильной президентской власти, и о «репутационной чистке элит», что, наоборот, могло показаться экспертам неочевидным или недоказанным явлением, хотя тема всплывает в неофициальной информационной повестке регулярно.
Таким образом можно констатировать, что ChatGPT способен распознавать глубинные контексты на довольно высоком уровне (совпадения составили больше половины), включая редкое, но показательное выявление уникальных контекстов, не замеченных людьми. Это может быть обозначено как следствие человеческого фактора невнимательности: помеченные уникальными контексты были проанализированы и признаны справедливыми, так же как и на предыдущем уровне анализа.
Однако, если на первом этапе можно было признать преимущество ИИ по адаптированию текстов включающим поверхностные смыслы, на данном уровне фактор ошибки (неточности, искажения) играл в аналитике гораздо более значимую роль. Здесь уместно привести пример из чувствительной в практическом смысле медицины, где ChatGPT всевозможных моделей демонстрировал до 1/5 неуместных и до более чем половины галлюцинирующих выходных данных (Chang, Farah, Gui, Rezaei et al., 2025).
Казалось бы, продукты новостной журналистики менее подвержены рискам при использовании в работе ИИ по отношению к медицине, где безоглядное доверие пациентов к выходным данным может приводить к прямому ущербу здоровью людей. Однако эффект может оказаться не столь скорым и явным, но не менее разрушительным.
Ошибочные смысловые наполнения, которые считывал ChatGPT, могли приводить к искажению локальной казахстанской действительности в глазах международного читателя. В случае, когда адаптированная новость содержит искажения, а за ретрансляцию или редактуру отвечает журналист вне локального контекста, это может привести к формированию устойчивых и ложных представлений о социальной, культурной и политической реальности освещаемого региона. Ситуация может ухудшиться, если процесс адаптации полностью автоматизирован или если редактура адаптации выполняется с помощью того же ChatGPT, который имеет тенденции к усилению собственной неточности. Воспринятые как достоверные искажения могут быть ретранслированы далее в медийную экспертизу или аналитические отчеты.
Исходя из этого, выявление, перепроверка и анализ возможных искажений в выходных данных становится критически важным слоем исследования. После первичного сопоставления результатов авторов и маркировки контекстов ChatGPT эксперты внесли свои дополнения. Часть из них совпала с теми контекстами, которые первоначально были помечены ошибочными. Этот процесс снизил уровень возможной субъективности или незнания конкретных аспектов со стороны авторов. Однако даже после введения данных экспертов было выявлено 26,8% ошибочных результатов по отношению к общему количеству контекстов ChatGPT, при гораздо меньшем, чем на первом уровне, но все же значительном соотношении совпадений. Только в 3 новостях из 11 ChatGPT не выдал ни одного ошибочного контекста.
Помимо повторов внутри контекстов ChatGPT, которые в итоговом смысловом значении дублировались между собой, нам удалось выделить пять устойчивых векторов ошибочных и искажающих интерпретаций.
Преувеличение символизма. ChatGPT был склонен к чрезмерному усилению смыслов явлений. Примеры: одна из казахстанских трасс, подлежащая ремонту, предстала «символом» единства государства (новость 2); площадь Республики в г. Алматы была интерпретирована как «сердце города», над которым критически важно установить контроль, при игнорировании ее будничных функций, в частности как места свадебных гуляний (новость 1); раздутое «символическое единство страны» через единый часовой пояс (новость 5).
Клиширование «советскости». Некоторые интерпретации ИИ опираются на устойчивые стереотипы об СССР, даже при отсутствии соответствующих признаков. Примеры: охранник, незаконно запрещавший фотографирование, предстал воплощением инерции «советского стремления к контролю» (новость 1); «Физическая сила» профессионального топового боксера интерпретирована как «культурная добродетель постсоветских стран» (новость 6); приветственная фраза президента К-Ж. Токаева показана как «характерная дипломатия постсоветского пространства» (новость 10).
Локализация международно-типичных явлений. ChatGPT неоднократно толковал довольно распространенные в мировой практике явления как присущие исключительно Казахстану и постсоветскому пространству. Примеры: психологическая работа с профессиональными футболистами преподносилось как «отражение военизированной философии советской школы» (новость 7); военный оркестр и почетный караул при возложении цветов к мемориалу выведены как признак серьезной роли «военной символики в государственной легитимности», при том что подобный церемониал, тем более в присутствии приглашенных иностранных делегаций, является довольно стандартным в США, Франции и др. (новость 11)
Легитимация извне. Вектор интерпретации заключался в том, что ИИ регулярно придавал внешним источникам, в частности российским, роль неоспоримого авторитета, на котором строится легитимность тех или иных институтов. Примеры: комментарий футбольного тренера на российском канале «Матч-ТВ» был представлен как ориентированность всего казахстанского спорта на «старшего брата» (новость 7); отзыв автора youtube-канала об очередной победе казахстанского чемпиона по боксу трактовался как важное для казахстанцев признание в формировании «легитимного национального самовосприятия» (новость 6).
Ошибочная причинность. Зафиксировано устойчивое присваивание инициативы действий властям, в частности президенту, в то время как причиной являлось некое общественное давление. Примеры: продолжение дискуссии о смене часового пояса в Казахстане ChatGPT объяснил как часть централизованной модели власти, тогда как в реальности оно стало результатом масштабного общественного недовольства и петиции (новость 5); важность футбольного матча российского чемпионата, согласно ИИ, заключалась в геополитическом участии Казахстана в жизни России, при игнорировании более прозаических причин, таких как спортивная гонка за первенство или следствие контракта казахстанского спортсмена с российским клубом (новость 7).
В ряде случаев один контекст содержал сразу несколько векторов интерпретационных искажений, что усложняло однозначную классификацию. Одним из примеров является ошибочный контекст о военных ритуалах, в котором одновременно проявляются черты преувеличения символизма и локализации типичных явлений. И тем не менее классификация была обусловлена тем, что ошибочные контексты не являлись случайными или единичными. Из-за неоднократных повторений можно делать вывод об ограничениях ChatGPT в интерпретации неоднозначных глубинных контекстов, что, в свою очередь, приводит к необходимости дополнительной проверки как самих адаптированных текстов, так и возможных уточненных выходных данных.
Обсуждения и ограничения
Для интерпретации полученных результатов необходимо учитывать особенности методологических решений, которые определили формат исследования и рамки для решения поставленных задач, связанных с возможностями применения ИИ в практической журналистике.
Формат противопоставления человеческих интерпретаций и выходных данных ИИ позволил выявить некую «мыслительную» разницу, проявившуюся как в уникальных смыслах, так и в искажениях. При этом во время сопоставления результатов общее количество выявленных контекстов на обоих уровнях анализа оставалось нерепрезентативным, т. к. ни одной из сторон не задавалось количественного ограничения. То есть этот пласт полученных данных не рассматривался для сравнения продуктивности человека (или людей) и ChatGPT, а именно как база для выявления расхождений, уникальных и ошибочных интерпретаций.
Примененный метод однозапросного формата взаимодействия с ChatGPT позволил зафиксировать первичную реакцию модели, приближенную к условиям ее применения в практической новостной журналистике, где некоторые процессы все чаще автоматизируются для достижения эффективности (Petruccio, Neilson, Stöcker, 2025). Неприменение уточняющих дополнительных запросов ограничивало модель в возможности корректировки, уточнения или даже полной переформулировки выявленных контекстов, но позволило избежать дополнительного взаимодействия, которое «создает новые задачи и новые формы работы» (Broussard, Diakopoulos, Guzman, Abebe et al., 2019), что противоречит необходимости максимизировать скорость и эффективность журналистской работы.
Кроме того, отдельного внимания заслуживает разработка самих запросов для дальнейшей генерации в соответствии с задачами исследования. Сами запросы могли быть уточнены, расширены и усилены. Однако парадокс заключается в том, что составление «безукоризненно эффективного» запроса требует предварительного знания того, в чем модель может ошибаться или искажать смыслы. То есть, чтобы задать точный запрос, пользователь должен заранее обладать теми знаниями, которые он рассчитывает получить из выходных данных, т. е. в результате своего запроса. Более того, в условиях ограниченного времени составление сложного запроса может оказаться менее рациональным, чем создание или адаптация текста вручную.
Таким образом, результаты исследования не только позволяют выявить векторы интерпретационных искажений, но и обозначают некоторые пределы эффективности конструирования запросов: чтобы сформулировать максимально точный запрос, условный журналист уже должен обладать знаниями о типичных сбоях модели, то есть знаниями, доступными только после проведения анализа, подобного предложенному в этой работе.
Кроме описанных, данное исследование имеет ряд ограничений, которые необходимо учитывать при интерпретации выводов.
С теми же целями, что и применение однозапросного формата, авторы и эксперты выявляли и формулировали контексты в условиях ограниченного времени (не более 10 минут на 1 новость). Данное ограничение могло отрицательно повлиять не только на количество обнаруженных контекстов, но и на глубину осмысления оригинальных текстов. Этот подход был обусловлен необходимостью выявить наиболее очевидные контексты, подобно тому как локальный журналист интуитивно улавливает глубинные смыслы, то есть для моделирования реалистичного восприятия.
Во-вторых, несмотря на разделения по журналистским рубрикам, анализ основывался на довольно ограниченной выборке оригинальных новостных материалов. Этот фактор не позволяет сделать однозначные обобщения по выходным данным ИИ в выявлении и интерпретации любых глубинных контекстов, однако выборки оказалось достаточно, чтобы выявить и классифицировать ряд устойчивых векторов искажений казахстанских реалий.
В-третьих, в исследовании применялась только одна модель генеративного ИИ (ChatGPT-4o), со всеми базовыми ограничениями. При этом использованная модель присутствовала в ограниченном доступе бесплатного плана OpenAI, что максимально облегчает воспроизводимость.
Выводы
Результаты исследования фиксируют определенный комплекс возможностей общедоступной и современной модели ChatGPT. Итоги первого уровня анализа позволяют констатировать высокое качество работы модели по переводу, адаптированию и обработке поверхностных контекстов в оригинальных русскоязычных новостях Казахстана. Второй уровень исследования позволил не только выявить устойчивые векторы смысловых искажений в работе, но и обозначить границы способностей модели при распознавании и анализе локальных социально значимых контекстов.
Одной из возможных причин выявленных векторов искажений относительно казахстанских глубинных контекстов может являться «универсальный» характер текстовых корпусов, на которых обучаются генеративные модели и который подчеркивают разработчики. Эти массивы текстовых данных могут не включать исторически и культурно специфичные тексты отдельных этносов или регионов. Вследствие приверженности «стандартизированным» ценностям и смыслам, существует риск потери генеративной моделью восприимчивости к уникальным локальным контекстам.
Однако, наряду с достаточно высоким количеством совпадающих результатов, исследование выявило способности модели выдавать нестандартные, неочевидные прочтения смыслов, не выявленных экспертами. Это позволяет рассмотреть перспективу применения моделей ИИ не только в качестве инструмента автоматизации журналистских процессов, но и источника альтернативных идей и прочтений.
Результаты данной работы могут быть полезными в работе журналистов, специализирующихся на новостях, и редакторских отделов, ответственных за трансляцию контента для международной аудитории. Материалы и результаты исследования позволяют точнее определить зоны риска и потенциала генеративных моделей при решении типовых редакционных задач, а именно: при разработке методик верификации и редактирования ИИ-адаптаций, при создании гибридных схем журналистской работы по типу «человек и ИИ», при определении жанров и тем, в которых применение генеративных моделей допустимо, ограничено или рискованно.
В контексте расширения возможностей применения классификации искажений, выводы доступны для использования не только в казахстанской медиаиндустрии, но и в других двуязычных регионах, где на фоне локальных культурных традиций и языков широко применяется русский язык. Выводы могут послужить основой или дополнением к дальнейшим исследованиям в области медиалингвистики, цифровой журналистики и развития стандартов этики применения искусственного интеллекта.
Примечания
1 Торегожина Б., Жовтис Е. «Стрелять на поражение…» Доклад о трагических январских событиях 2022 года в Казахстане. Центр документирования Правозащитного Альянса Казахстана в поддержку фундаментальных прав, 2023. Режим доступа: https://bureau.kz/wp-content/uploads/2023/06/ru_final.pdf (дата обращения: 12.04.2025).
2 GPT-4 Technical Report. OpenAI Technical Report. San Francisco: OpenAI Inc. Available at: https://deepai.org/publication/gpt-4-technical-report (accessed: 14.04.2025).
3 Interim Report: Governing AI for Humanity. Available at: https://www.un.org/sites/un2.un.org/files/ai_advisory_body_interim_report.pdf (accessed: 12.04.2025).
4 GPT-4 Technical Report. OpenAI Technical Report. San Francisco: OpenAI Inc. Available at: https://deepai.org/publication/gpt-4-technical-report (accessed: 14.04.2025).
5 White J., Fu Q., Hays S., Sandborn M., Olea C., Gilbert H., Elnashar A., Spencer-Smith J., Schmidt D. (2023) A prompt pattern catalog to enhance prompt engineering with ChatGPT. Available at: https://arxiv.org/abs/2302.11382 (accessed: 10.04.2025).
6 Wei J., Wang X., Schuurmans D., Bosma M., Chi E., Le Q., Zhou D. (2022) Chain of Thought Prompting Elicits Reasoning in Large Language Models. Available at: https://arxiv.org/abs/2201.11903 (accessed: 10.04.2025).
7 Модель GPT-4o продемонстрировала стабильное понимание контекста, логическую связность и способность к элементарному анализу. Оба обозначенных запроса (каждый для 11 новостных заметок, то есть 22 раза) в рамках исследования направлялись в одном и том же окне, при условиях ограниченного использования в бесплатном пакете, что обеспечивает сопоставимость выходных результатов.
8 Постановление Правительства Республики Казахстан от 28 марта 2023 года № 247. Об утверждении Концепции государственной молодежной политики Республики Казахстан на 2023–2029 годы. Режим доступа: https://adilet.zan.kz/rus/docs/P2300000247 (дата обращения: 9.04.2025).
Библиография
Абылхожин Ж. Б., Крупко И. В. Идеологические дискуссии и поиск исторической субъектности казахстанского общества в ХХ веке // Новые исследования Тувы. 2024. № 3. С. 265–278. DOI: 10.25178/nit.2024.3.15
Аманжолова Д. Б., Искендир А. А., Шаймерденова Н. Ж. Коммуникативный и лингводидактический потенциал эпистолярных текстов: прикладной аспект (на материале почтовой корреспонденции Д.А. Монгуша – А. С. Аманжолову) // Новые исследования Тувы. 2024. № 3. С. 240–264. DOI: 10.25178/nit.2024.3.14
Давыдов С. Г., Замков А. В., Крашенинникова М. А., Лукина М. М. Использование технологий искусственного интеллекта в российских медиа и журналистике // Вестник Московского университета. Серия 10. Журналистика. 2023. № 5. С. 3–21. DOI: 10.30547/vestnik.journ.5.2023.321
Дугин Е. Я. Трансформация медиакоммуникации под воздействием цифровых технологий: теоретико-методологический аспект // Вестник Московского университета. Серия 10. Журналистика. № 5. С. 140–151. DOI: 10.55959/msu.vestnik.journ.5.2024.140151
Казун А. Д. Перспективные направления исследований потребления новостей в контексте медиасреды с большим выбором // Вестник Московского университета. Серия 10. Журналистика. 2024. № 2. С. 3–47. DOI: 10.30547/vestnik.journ.2.2024.347
Мамбетова Г. Т., Шингарева М. Ю., Дмитрюк Н. В., Стычева О. А. Сопоставительный анализ фразеологических единиц с соматизмом рука как способ формирования лингвокультурной компетенции (на материале русского, казахского, тувинского и английского языков) // Новые исследования Тувы. 2023. № 4. С. 109–123. DOI: 10.25178/nit.2023.4.8
Новикова М. Л., Новиков Ф. Н. Использование искусственного интеллекта для создания системы машинного перевода и образовательных ресурсов на тувинском языке // Новые исследования Тувы. 2024. № 1. С. 6–17. DOI: 10.25178/nit.2024.1.1
Abisheva C., Koldasbaeva Z., Nossiyeva N., Irgebaeva N., Aipova А., Doldinova S., Smoilov S., Aykenova R., Umirzakova L., Idrissova M. (2024) Formation of Ethical Competences for AI Use in English Foreign Language Teachings. Qubahan Academic Journal 4 (4): 191–205. DOI: 10.48161/qaj.v4n4a1256
Broussard M., Diakopoulos N., Guzman A. L., Abebe R., Dupagne M., Chuan C.-H. (2019) Artificial Intelligence and Journalism. Journalism & Mass Communication Quarterly 96 (3): 673–695. DOI: 10.1177/1077699019859901
Chang C. T., Farah H., Gui H., Rezaei Sh. J. et al. (2025) Red teaming ChatGPT in medicine to yield real-world insights on model behavior. Digital Medicine 8: 149. DOI: 10.1038/s41746-025-01542-0
Dergaa I., Chamari K., Zmijewski P., Ben Saad H. (2023) From human writing to artificial intelligence generated text: examining the prospects and potential threats of ChatGPT in academic writing. Biology of Sport 40 (2): 615–622. DOI: 10.5114/biolsport.2023.125623
Duan J. (2024) Identification and influence of tourism consumption behavior based on artificial intelligence. Informatica (Ljubljana) 48 (15): 135–150. DOI: 10.31449/inf.v48i15.6203
El-Tigani A. (2024) The Reality of Using ChatGPT in Media Studies for Students, Scholars, and Practitioners. Herald of Journalism 74 (4): 4–18. DOI: 10.26577/HJ.2024.v74.i4.1
Hassouni A., Mellor N. (2025) AI in the United Arab Emirates’ Media Sector: Balancing Efficiency and Cultural Integrity. Journalism and Media 6 (1). DOI: 10.3390/journalmedia6010031
Izadi S., Forouzanfar M. (2024) Error Correction and Adaptation in Conversational AI: A Review of Techniques and Applications in Chatbots. AI 5: 803–841. DOI: 10.3390/ai5020041
Kalla D., Smith N., Samaah F., Kuraku S. (2023) Study and Analysis of Chat GPT and its Impact on Different Fields of Study. International Journal of Innovative Science and Research Technology 8 (3).
Lee M. A. (2023) Mathematical Interpretation of Autoregressive Generative Pre-Trained Transformer and Self-Supervised Learning. Mathematics 11 (11): 2451. DOI: 10.3390/math11112451
Nurash A., Rozhkov A. (2024) Thematic programs (television) and periodicals on the culture of the period of independence of Kazakhstan (content, methods of their formation)]. Herald of Journalism 73 (3): 132–141. DOI: 10.26577/HJ.2024.v73.i3.11
Ogunde F. (2025) Legal large language models (LLMs): legal dynamos or “fancifully packaged ChatGPT”? Discover Artificial Intelligence 5 (21). DOI: 10.1007/s44163-024-00167-8
Oprea S. V., Bâra A. (2025) Interpreting text corpora from androids-related stories using large language models: “Machines like me” by Ian McEwan in generative AI // Humanities and Social Sciences Communication 12. DOI:10.1057/s41599-025-04633-1
Petruccio P., Neilson T., Stöcker C. (2025) ‘A Part of Our Work Disappeared’: AI Automated Publishing in Social Media Journalism. Journalism and Media, 6 (1). DOI: 10.3390/journalmedia6010030
Upadhyaya N. (2024) AI-Augmented Dynamic Language Adaptation for Low-Resource Languages: A Transfer Learning Solution for Optimized NLP Performance. International Research Journal of Advanced Engineering and Science 9 (4): 89–94.
Zelianskaia N. L., Belousov K. I., Sychov O. A., Galinskaia T. N. (2023) Semantic structure of clickbait headlines and internet user activities. Media Linguistics 10 (1): 66–86. DOI: 10.21638/spbu22.2023.104
Как цитировать: Ахметов С. С., Ахметова Л. С. Локальные контексты в адаптации искусственного интеллекта: человеческое и машинное понимание казахстанских новостей // Вестник Московского университета. Серия 10. Журналистика. 2025. № 4. С. 24–49. DOI: 10.55959/msu.vestnik.journ.4.2025.2449
Поступила в редакцию 29.04.2025

