Коли ChatGPT нічого не знає. Чи такий просунутий Китай, коли йдеться про ШІ?
У майбутньому штучного інтелекту для Китаю виникає велике «якщо» через чинну в країні цензуру
У книзі «Наддержави штучного інтелекту» (2018 рік), яка стала вже класичною, Кай-Фу Лі кинув рукавичку: він стверджував, що Китай становить усе більшу технологічну загрозу для США. Наприкінці 2019 року, коли Лі виступав із лекцією на моєму семінарі «Майбутній Китай» у Єльському університеті, студенти були зачаровані його провокаційними аргументами: Америка ось-ось утратить свою перевагу першовідкривача (експертиза в алгоритмах штучного інтелекту) через переваги Китаю у впровадженні (застосунки на основі великих даних).
На жаль, Лі проігнорував одну ключову тенденцію: розквіт великих мовних моделей і генеративного штучного інтелекту. Хоча він натякав на масову форму технології загального призначення, зводячи її ще до часів Промислової революції, він був дуже далекий від передбачення істерії навколо ChatGPT, що зараз захлеснула дебати з приводу штучного інтелекту (скорочено ШІ). Аргументи Лі містили туманні згадки «глибинного навчання» та нейронних мереж, однак вони спиралися скоріше на міркування про потенційну заміну штучним інтелектом людей у виконанні їхніх завдань, ніж про можливості «загального штучного інтелекту», близького до людського мислення. А це важко назвати чимось маловажливим, коли йдеться про майбутнє Китаю як ШІ-наддержави.
Причина в тому, що в цьому майбутньому виникає велике «якщо» через чинну в Китаї цензуру. У нещодавній статті Генрі Кіссінджер, Ерік Шмідт і Деніел Гаттенлокер (у їхній книзі 2021 року містилися натяки на потенціал ШІ загального призначення) наводять сильні аргументи, доводячи, що наразі ми опинилися на порозі інтелектуальної революції, яка стає можливою завдяки ChatGPT. Вони не тільки вказують на моральні та філософські проблеми, створювані великими мовними генеративними моделями, а й піднімають важливі практичні питання щодо їхнього впровадження, що безпосередньо пов’язані з розмірами корпусу знань, наявних в оброблюваній мові.
Китай отримав найнижчий бал у категорії «Свобода інтернету» серед 70 країн
Саме тут режим суворої цензури в Китаї починає викликати стурбованість. І на Сході, і на Заході є довга і багата історія цензури, проте відділ пропаганди Комуністичної партії Китаю особливо виділяється своїми стараннями контролювати будь-які форми висловлювань у китайському суспільстві (газети, фільми, література, медіа, освіта), а також управляти культурою і цінностями, що визначають публічні дискусії.
На відміну від Заходу, де все що завгодно потрапляє в мережу, цензори Китаю нав’язують суворі політичні правила поширення інформації, що має відповідати лінії КПК. Користувачі інтернету в Китаї не можуть завантажити посилання на інформацію про Культурну революцію, що тривала десять років, про трагедію червня 1989 року на площі Тяньаньмень, проблеми з правами людини в Тибеті та Сіньцзяні, непорозуміння з Тайванем, демократичні демонстрації 2019 року в Гонконзі, невдоволення політикою нульового Covid і про багато іншого.
Настільки агресивне редагування інформації стає великою проблемою для ChatGPT з китайською специфікою. Очистивши історію від важливих подій і пов’язаного з ними людського досвіду, китайська цензура звужує та спотворює корпус інформації, який використовуватиметься для машинного навчання великих мовних моделей. А це означає, що здатність Китаю пожинати плоди інтелектуальної ШІ-революції в підсумку зменшиться.

Кількісно виміряти ефект цієї цензури з точністю, звісно, неможливо. Якісні оцінки можна знайти в щорічному опитуванні, проведеному організацією Freedom House, «Свобода в мережі». У 2022 році Китай отримав найнижчий бал у категорії «Свобода інтернету» серед 70 країн.
Цей показник розраховують на підставі відповідей на 21 запитання (і на майже 100 уточнювальних запитань), які згруповані в три широкі категорії: перешкоди в доступі, порушення прав користувачів, обмеження контенту. Категорія, що стосується контенту (фільтрація та блокування веб-сайтів, юридичні обмеження контенту, жвавість і різноманітність інформаційної онлайн-сфери, використання цифрових інструментів для громадянської мобілізації), дає змогу приблизно виміряти вплив цензури на розміри доступної для пошуку інформації. Китай, згідно з цими підрахунками, отримав два бали з 35 можливих, тоді як середній бал дорівнював 20.
У майбутньому ми можемо очікувати продовження того самого. Китайський уряд уже поспішив випустити проєкт нових правил про чатботів. 11 квітня Китайське управління кіберпростору (CAC) ухвалило, що контент, який створює генеративний ШІ, має «спиратися на базові соціалістичні цінності та не повинен містити будь-якого контенту, що підриває державну владу, пропонує повалити соціалістичну систему, підбурює до розколу країни або підриває національну єдність».
І тут з’являється найважливіша відмінність між колишнім режимом цензури і новими спробами нагляду над ШІ. У першому випадку застосовують фільтрацію контенту за ключовими словами з метою заблокувати неприйнятну інформацію, а в другому випадку (і про це йшлося на нещодавньому форумі DigiChina) використовують підхід із гри «Убий крота» для обмеження швидко мінливого генеративного опрацювання подібної інформації. У результаті, чим жорсткіше САС намагатиметься контролювати контент ChatGPT, тим менше буде продукції у чатбот-генеративного штучного китайського інтелекту. А це ще одна перешкода на шляху інтелектуальної ШІ-революції в Китаї.
Не дивно, що перші результати роботи генеративного ШІ в Китаї викликали розчарування. Одну з перших і найвідомішу на сьогодні велику мовну модель Китаю — програму Wenxin Yiyan компанії Baidu (її називають «бот Ерні») — нещодавно розкритикували в Wired за спробу працювати в «інтернеті, закритому файрволом і керованому державною цензурою». Настільки ж прикрісні результати повідомляють і про інші мовні ШІ-моделі в Китаї, серед яких Robot, Lily і Tongyi Qianwen компанії Alibaba (перекладається приблизно як «правда з тисячі запитань»).
Крім того, недавній аналіз, проведений NewsGuard (це «інструмент довіри в інтернеті», створений і підтримуваний великою командою шанованих західних журналістів), показав, що програма ChatGPT-3.5 компанії OpenAI генерувала більше неправдивої інформації (так звані «галюцинації») китайською мовою, ніж англійською.
У чудовій книжці філолога Цзін Цу «Царство ієрогліфів: Мовна революція, що зробила Китай сучасним» підкреслюється критично важлива роль, яку відіграла мова в еволюції Китаю після 1900 року. Зрештою мова — це не більше ніж носій інформації, і у фінальному розділі своєї книги Цу підкреслює цей факт, стверджуючи, що «той, хто контролює інформацію, контролює світ».
В епоху ШІ такий висновок змушує Китай замислитися над серйозними питаннями. Інформація — це паливо для великих мовних ШІ-моделей. А державна цензура стискає Китай до малих мовних моделей. Ця різниця цілком може мати вирішальний вплив на результат битви за інформаційний контроль і глобальну владу.
NV має ексклюзивне право на переклад і публікацію колонок Project Syndicate. Републікація повної версії тексту заборонена.
Авторське право: Project Syndicate 2023
Приєднуйтесь до нашого телеграм-каналу Погляди NV