ChatGPT стане іншим: OpenAI оновила правила поведінки для ШІ
ChatGPT стане іншим: OpenAI оновила правила поведінки для ШІ

ChatGPT стане іншим: OpenAI оновила правила поведінки для ШІ

Нова версія містить 63 сторінки, тоді як попередня мала лише 10, повідомляє 24 Канал. У документі роз'яснюється, як моделі ШІ повинні обробляти запити та відповідати відповідно до налаштувань користувача.

Основними принципами стали кастомізація, прозорість та "інтелектуальна свобода", яка передбачає можливість обговорювати різні питання без довільних обмежень.

Оновлений Model Spec включає аналіз найгучніших інцидентів, пов’язаних з етикою ШІ, що трапилися за останній рік. OpenAI також навела приклади запитів і коректних відповідей, а також варіантів, що порушують встановлені правила.

  • Наприклад, моделі ШІ не повинні відтворювати матеріали, захищені авторським правом, або використовуватися для обходу платного доступу.
  • ШІ не може заохочувати до самопошкодження – у галузі вже були подібні інциденти.

Також внесено зміни у ставлення ШІ до суперечливих тем.

  • Замість уникнення обговорень моделі мають "разом шукати правду" з користувачами, водночас дотримуючись чітких моральних позицій щодо таких питань, як дезінформація та завдання шкоди.

OpenAI також переглянула підхід до контенту для дорослих: компанія розглядає можливість дозволу певних його типів, зберігаючи заборону на явно нелегальні матеріали.

Нові правила передбачають можливість опрацювання чутливих матеріалів, але не їх створення.

  • Наприклад, можна перекладати тексти про речовини, що перебувають під обмеженим обігом, але не генерувати новий контент на цю тему.

ШІ може проявляти емпатію, але без нещирих емоцій. Основний акцент зроблено на корисності ШІ, дотриманні меж та уникненні зайвої піддатливості.

Окремо наголошено на проблемі "підлабузництва" моделей. ChatGPT повинен давати однакові фактичні відповіді незалежно від формулювання запиту, надавати чесний зворотний зв’язок замість необґрунтованої похвали та діяти як вдумливий колега, а не намагатися догодити.

Якщо користувач просить критику, ШІ має надавати конструктивний аналіз, а у разі помилкових тверджень – ввічливо їх виправляти.

Документ визначає чітку ієрархію пріоритетів: спочатку йдуть правила OpenAI, потім рекомендації розробників, а після цього – налаштування користувачів. Це дозволяє зрозуміти, які аспекти ШІ можуть бути змінені, а які залишаються незмінними.

Model Spec розповсюджується під ліцензією Creative Commons Zero (CC0), що фактично робить його загальнодоступним. Це означає, що компанії та дослідники можуть використовувати, змінювати або розширювати ці керівні принципи.

Хоча миттєвих змін у поведінці ChatGPT та інших продуктів OpenAI не буде, нові моделі поступово адаптуватимуться до оновлених правил. Також компанія публікує перелік тестових запитів, які використовуються для перевірки відповідності моделей новим стандартам.

Теги за темою
Техно
Джерело матеріала
loader
loader