На нейронному рівні ми є не меншими “плаґіаторами”, ніж ШІ
Дуже, дуже довгий текст. Про ШІ й не лише.
Отже…
Друзі, мене тішить увага до книжок “Бородатого Тамарина”, але невимовно засмучує потреба писати цей пост.
Засмучує, бо я розумію його марність. Є питання, виважена й аргументована суперечка щодо яких — принаймні на сьогодні — неможлива.
Чи спричиняють вакцини аутизм? Чи шкодить атомна енергетика довкіллю? Чи використання паперових соломинок рятує планету?
Перша проблема тут: простої відповіді недостатньо. Недостатньо сказати «ні, ні й ще раз ні». Відповідь треба обґрунтувати, а для цього потрібен час і — що важливіше — терпіння у співрозмовника. Й це підводить до другої проблеми: всі ці запитання — це завжди протистояння раціонального й емоційного, і про терпіння зазвичай не йдеться. Я, на жаль, іще ні разу не бачив, щоб у зіткненні раціо й емоції перемагало раціо.
Вакцини спричиняють аутизм? — Ні. — Отже, ти хочеш, щоб діти страждали?!
АЕС забруднюють довкілля? — Ні. — Ти прагнеш знищити планету?!
Паперові соломинки рятують Землю від пластикового сміття. — Ні. — Невже тобі байдуже до тварин, які гинуть в океані?!
Те саме з ШІ. Системи так званого «штучного інтелекту» не є інтелектом від слова взагалі й не мають нічого спільного з більшістю загроз, які їм приписують. Але, певна річ, такий аргумент блякне, коли у відповідь лунає обурене: як ти смієш підтримувати крадіїв і позбавляти художників роботи?!
Найкраща стратегія в таких випадках — не вв’язуватися в суперечку. Чому я все ж це пишу? Читомо звернулися до «Бородатого Тамарина» й інших видавців за коментарем щодо використання ШІ, і я загалом уявляю, якою буде стаття. Я також усвідомлюю, що обґрунтована відповідь не втиснеться у три коротенькі речення, тож змушений викочувати полотно у фейсбуці.
Почнімо з того, чому я взагалі вважаю, що я достатньо кваліфікований, щоб висловлювати думку з приводу ШІ.
20 років тому я займався розробкою систем автоматизованого проєктування (САПР). Це загалом безневинні інженерні програми, які спрощують або автоматизують якийсь інженерний процес. Серед них є особливий клас програм, який ми (20 років тому) називали системами розпізнавання і які своєю чергою є частковим випадком систем, що здатні до самонавчання. На фундаментальному рівні це програми, які вміють попіксельно аналізувати зображення й мають вбудований алгоритм навчання. Навіщо вони? Ну, скажімо, ви показуєте такій програмі тисячі різних овочів — помідори, огірки, капусту тощо, — вона аналізує зображення й запам’ятовує певні повторювані патерни. Це процес навчання. Після його завершення ви знову показуєте програмі різні овочі, й тепер вона, базуючись на отриманих знаннях, розпізнає, що ось це — помідор, а це — капуста. Наголошу: в таких системах ніде не зберігається зображення помідорів, огірків чи капусти. Це просто алгоритм.
Минуло 20 років, й нове покоління програмістів, які вдосконалили ці програми, чомусь почали називати їх «штучним інтелектом». Розумними програми від того не стали, проте важливо інше. Я хочу, щоб ви зрозуміли: системи ШІ не зберігають ні опрацьовані зображення, ні їхні частини (це нонсенс: нам знадобився б іще один всесвітній інтернет, щоби вмістити всю інформацію, потрібну для роботи одного Midjourney). Системи ШІ шляхом машинного навчання формують патерни, які дозволяють їм відтворювати те, що, грубо кажучи, подобалося людям, які їх навчали. Звідси випливає їхня шаблонність й повторюваність помилок (два ряди зубів на нижніх щелепах, схожість емоцій на різних обличчях, проблеми з долонями, шасі в літаків тощо), але мова зараз не про це.
Пригадайте зображення з розмитим водяним знаком. Його поширювали, як доказ того, нібито Midjourney краде картинки зі стоку й видає їх за свої. На жаль, це зображення фейкове. Створене навмисно, щоби ввести в оману й підтримати хибну тезу. Ні, звісно, його робили в Midjourney. От тільки Midjourney сам собою не міг намалювати водяний знак, він не містить у собі такої інформації, він міг намалювати його лише в разі, коли йому цей знак підсунули. Автор зображення взяв за основу стокову картинку, в підказці попросив обробити її в той чи той спосіб, і — вуаля — на виході з Midjourney ви маєте ідеальну картинку на хоругви для хрестового походу «за все хороше і проти всього поганого».
Поясню більше на прикладі: уявімо, я хочу отримати зображення себе в скафандрі. Я завантажую в Midjourney картинку скафандра, завантажую своє фото й пишу prompt (підказку): зобрази обличчя ось цього чоловіка в цьому скафандрі на Марсі. Й Midjourney, як уміє, намагається це намалювати. І якщо зображення скафандра було захищене авторським правом, то це проблема моя, а не Midjourney. Я цілком міг би створити щось подібне у Photoshop (ну, гаразд, не я, хтось інший, я не достатньо вправний для цього), але я чомусь не бачу натовпу розлючених художників, які вимагають спалити офіс Adobe й лінчувати всіх, хто користується Photoshop’ом.
Так само з цілою низкою згенерованих ШІ зображень, які відтворюють уже існуючі мистецькі роботи: вони могли бути створені, лише якщо хтось підклав Midjourney оригінали й попросив у підказці їх відретушувати.
Відтак Midjourney (й інші подібні системи) — це просто інструмент. Він не добрий і не поганий. Як і у випадку з усіма іншими винайденими людиною інструментами, результат його застосування безпосередньо залежить від руки, яка його тримає.
Що ще більш важливо — це інструмент жахливо недосконалий, що підтвердить будь-хто, хто попрацював у ньому хоча б добу. І ця недосконалість — його фундаментальна риса. Так, він генерує яскраві зображення, але вони здебільшого позбавлені контексту, а тому їхнє застосування вкрай обмежене. Midjourney не відбере роботу в, скажімо, Катерини Кошелевої, яка малювала ілюстрації для «Колонії», бо ніколи — ніколи! — навіть не наблизиться до її рівня. Він ніколи не відбере роботу в Федора Гонци, який створював нам тривимірні карти, бо це не «інтелект», Midjourney не розуміє, що робить, й може удосконалюватися лише в межах обмеженого алгоритму.
Це не означає, що з такими системами немає проблем. Midjourney навчається на роботах інших. Моя думка тут така, що ми всі навчаємося на роботах інших, і рівень деконструювання зображень у Midjourney загалом переважає цю здатність у художників-людей, тож на нейронному рівні ми є не меншими «плагіаторами», ніж ШІ. Є також проблема ліцензування, і тут до дискусії мають долучитися люди значно більш поінформовані й кваліфікованіші, ніж я. І я готовий почути аргументи у відповідь і — в разі, якщо вони виявляться достатньо переконливими, — змінити свою думку. Головне, що я хочу донести зараз: так званий ШІ не відбирає роботу в художників, так само, як Google translate не відбирає її у перекладачів, а банкомати у касирів.
Так, поява ШІ змінить галузь. Власне, вже змінює. Ці зміни стрімкі, тож це нормально, що вони лякають. Я можу порівняти появу ШІ з упровадженням формату mp3 у 90-х. Тоді багато хто говорив, що це стане кінцем комерційної музики, що всі виконавці збанкрутують (я сам належав до таких людей; власне, ще до 2015-го купував музику лише на ліцензійних дисках), але погодьмося, за 30 років по тому трохи дивно слухати історії про хрестові походи «за все хороше і проти формату mp3».
Макс Кідрук, літератор
На світлині: картина, створена за допомогою ШІ й продана майже за 500 тисяч доларів
Мову ориґіналу збережено
Politarena.org — незалежне видання без навʼязливої реклами й замовних матеріалів. Щоб працювати далі в умовинах війни та економічної кризи, нам потрібна ваша підтримка. Щоб продовжувати реалізовувати проєкт щодо документування англійською мовою рашистських злочинів проти мирних громадян України, зокрема дітей, нам потрібна ваша допомога. Про готовість підтримати видання зголошуйтеся на пошту politarena()ukr.net. Або ж переказуйте кошти на карту 4731 2196 4385 1292 (ПриватБанк)
Підписуйтеся на наш Телеграм