Вчора

30 тисяч бойових роботів для перемоги: Україна створює роботизовану армію

Чорний ринок смерті: як українські похоронні компанії полюють на клієнтів

Докладніше

16.11.2025

Чорний ринок смерті: як українські похоронні компанії полюють на клієнтів

«Порно-Діснейленд»: чим живе світова секс-столиця

Докладніше

15.11.2025

«Порно-Діснейленд»: чим живе світова секс-столиця

Україна отримала потужну зброю, якої в неї ще не було

Докладніше

14.11.2025

Україна отримала потужну зброю, якої в неї ще не було

У Німеччині почали урізати допомогу українським біженцям

Докладніше

13.11.2025

У Німеччині почали урізати допомогу українським біженцям

Хто такий Тимур Міндіч і що потрібно знати про наймасштабніший корупційний скандал в Україні

Докладніше

12.11.2025

Хто такий Тимур Міндіч і що потрібно знати про наймасштабніший корупційний скандал в Україні

"Першими, хто хоче закінчення війни, є військові" - полковник ЗСУ

Докладніше

11.11.2025

"Першими, хто хоче закінчення війни, є військові" - полковник ЗСУ

Атаки на українські електростанції: чи буде енергетичний колапс?

Докладніше

10.11.2025

Атаки на українські електростанції: чи буде енергетичний колапс?

Ця ягода підкорила весь світ: вона уповільнює старіння та запобігає раку

Докладніше

09.11.2025

Ця ягода підкорила весь світ: вона уповільнює старіння та запобігає раку

Ранковий секс є запорукою кар'єрного успіху

Докладніше

08.11.2025

Ранковий секс є запорукою кар'єрного успіху

Спецназ Великобританії готується до війни з Росією у бункері на кілометровій глибині

Докладніше

07.11.2025

Спецназ Великобританії готується до війни з Росією у бункері на кілометровій глибині

У кого більше ядерних боєголовок: у США, Росії чи Китаю?

Докладніше

06.11.2025

У кого більше ядерних боєголовок: у США, Росії чи Китаю?

Львів багатіє, Харків хиріє: як війна змінює Україну

Докладніше

05.11.2025

Львів багатіє, Харків хиріє: як війна змінює Україну

В Миколаєві відновила роботу міська організація ВО «Батьківщина»

Докладніше

04.11.2025

В Миколаєві відновила роботу міська організація ВО «Батьківщина»

Мультипіч 2025: 5 переваг для вашої кухні

Докладніше

03.11.2025

Мультипіч 2025: 5 переваг для вашої кухні

Вчені розкрили таємну мову спілкування між системами AI

28.07.2025 в 06:00

читать на русском

Дослідники зі сфери штучного інтелекту з компаній Anthropic та Truthful AI виявили незвичайне й тривожне явище, яке вони назвали «підсвідомленим навчанням» мовних моделей. Йдеться про те, що моделі ШІ можуть передавати одна одній складні шаблони поведінки навіть через, на перший погляд, нейтральні й безпечні набори даних. Це відкриття ставить під сумнів ефективність традиційних методів контролю змісту, які використовуються для запобігання шкідливій поведінці систем ШІ.

У рамках дослідження моделі-«вчителі» — зокрема GPT-4.1 — використовувалися для навчання інших мовних моделей. Примітно, що навчальні дані містили лише тризначні числа, без жодного відверто шкідливого або чутливого контенту. Попри це, моделі-«учні» демонстрували проблемні поведінкові реакції: від виправдання насильства до підтримки незаконних дій. Ба більше, ці реакції іноді ставали ще більш вираженими, ніж у моделей-«вчителів».

Ключовим відкриттям стало те, що навіть після ретельної фільтрації даних на предмет токсичності та етичної небезпеки, у моделях все одно проявлялася небажана поведінка. Це дало змогу припустити, що самі набори даних можуть містити приховані патерни, які непомітні для людини, але розпізнаються іншими системами ШІ на рівні статистичних закономірностей.

Цей ефект, як з’ясувалося, виникає лише тоді, коли моделі мають подібну архітектуру. Тобто «поведінкові структури» передаються лише між системами зі схожими внутрішніми принципами роботи. Це наштовхує на думку, що штучний інтелект здатен передавати складну інформацію не через явне текстове навчання, а через глибокі структурні співвідношення в даних, які він генерує або обробляє.

Найбільше занепокоєння викликає те, що звичні методи фільтрації контенту, на які покладається індустрія для забезпечення безпечної поведінки моделей, виявилися неефективними. Дослідження демонструє: проблемні шаблони поведінки можуть з’являтися не лише внаслідок прямого навчання на токсичному вмісті, але й через вторинні, підсвідомі впливи, що виникають у процесі передачі даних між ШІ.

Це відкриття ставить нові виклики перед дослідниками та розробниками у сфері безпеки штучного інтелекту. Необхідно переглянути як самі принципи створення тренувальних наборів, так і стратегії перевірки та обмеження поведінки моделей. З розширенням впливу ШІ у критичних сферах суспільства важливо гарантувати, що навіть «підсвідомі» шари навчання не несуть прихованої загрози.

portaltele.com.ua

Підписатися:Google News