Як працуе AI Background Removal

Нетэхнічны погляд на тэхналогію, якая робіць магчымым аўтаматычнае выдаленне фону.

Праблема

Тое, што людзям здаецца простым — ідэнтыфікацыя «асноўнага аб’екта» фатаграфіі — для камп’ютараў дзіўна складанае. Відарыс - гэта проста сетка каляровых пікселяў. Няма ўласцівай этыкеткі "гэты піксель - чалавек" і "гэты піксель - сцяна за ім".

Традыцыйныя падыходы выкарыстоўвалі такія метады, як парог колеру (выдаленне ўсіх пікселяў пэўнага колеру) або выяўленне краёў (знаходжанне межаў паміж аб'ектамі). Гэта спрацавала ў простых выпадках, але не атрымалася са складанымі сцэнамі, падобнымі колерамі аб'екта і фону або складанымі дэталямі.

Увядзіце машыннае навучанне

Сучаснае выдаленне фону AI выкарыстоўвае глыбокае навучанне - у прыватнасці, мадэлі сегментацыі малюнкаў. Вось спрошчаная версія таго, як гэта працуе:

1. Навучанне

Нейронная сетка паказвае мільёны малюнкаў, дзе аб'ект ужо быў ідэнтыфікаваны ўручную (пазначаны). З часам мадэль вывучае заканамернасці: як выглядаюць людзі, якой формы аб'екты, чым прадметы адрозніваюцца ад фону. Ён вучыцца распазнаваць краю, тэкстуры і кантэкст.

2. Вывад (з дапамогай мадэлі)

Калі вы даяце навучанай мадэлі новы відарыс, якога яна ніколі раней не бачыла, яна аналізуе піксельныя даныя і стварае «маску» — карту, якая прысвойвае кожнаму пікселю верагоднасць таго, што ён знаходзіцца на пярэднім плане (аб'екце) або заднім. Пікселі пярэдняга плана з высокай упэўненасцю захоўваюцца; фонавыя пікселі з высокім упэўненасцю выдаляюцца.

3. Апрацоўка краю

Пераход паміж пярэднім і заднім планам мае вырашальнае значэнне. Сучасныя мадэлі ствараюць мяккія краю (частковая празрыстасць), а не цвёрдыя бінарныя выразы. Гэта стварае натуральныя вынікі, асабліва вакол складаных краёў.

Чаму графічныя працэсары важныя

Нейронныя сеткі апрацоўваюць выявы з дапамогай тысяч матэматычных аперацый адначасова. Графічныя працэсары (графічныя апрацоўшчыкі) прызначаны менавіта для такога роду паралельных вылічэнняў. Задача, якая можа заняць 30 секунд на працэсары, можа быць выканана за 2-3 секунды на графічным працэсары.

Вось чаму такія інструменты, як QuickRemove, падтрымліваюць паскарэнне GPU ад графічных працэсараў NVIDIA, AMD і Intel. Мадэль AI працуе непасрэдна на вашым графічным працэсары для хуткай апрацоўкі. Калі сумяшчальны графічны працэсар адсутнічае, праграмнае забеспячэнне вяртаецца да апрацоўкі цэнтральным працэсарам — яно па-ранейшаму працуе, проста займае больш часу.

У чым добры штучны інтэлект

Людзі і партрэты — гэта самы распаўсюджаны варыянт выкарыстання, і мадэлі добра на ім навучаюцца
Жывёлы і хатнія жывёлы — мадэлі добра спраўляюцца з поўсцю і формамі жывёл
Прадукты і аб'екты — выразна акрэсленыя аб'екты з выразнымі межамі
Транспартныя сродкі — аўтамабілі, ровары і падобныя прадметы
Складаны фон — штучны інтэлект можа аддзяляць аб'екты ад напружанага дэталёвага фону

Задачы для ІІ

Празрыстыя аб'екты - шкло, вада і іншыя празрыстыя матэрыялы складаныя (QuickRemove ўключае спецыяльныя сродкі для гэтага)
Падабенства колераў — калі аб'ект і фон вельмі падобныя па колеры, выявіць межы цяжэй
Надзвычай складаныя сцэны — некалькі аб'ектаў, якія перакрываюцца, або неадназначны пярэдні/задні план

Постапрацоўка

Пасля таго як штучны інтэлект стварае першапачатковую маску, пост-апрацоўка ўдакладняе вынік. Такія інструменты, як QuickRemove, прапануюць:

Размыванне краёў — змякчэнне пераходу паміж аб'ектам і фонам
Згладжванне — памяншэнне няроўных краёў
Ачыстка колеру — выдаленне разліву колеру там, дзе зыходны колер фону перацякае па краях аб'екта
Ручная пэндзаль/гумка — для тонкіх выпраўленняў штучны інтэлект можа прапусціць

Ніжняя лінія

Выдаленне фону штучным інтэлектам дасягнула такой ступені, што за лічаныя секунды дае вынікі прафесійнай якасці. Нягледзячы на тое, што гэта не ідэальна ў кожным сцэнары, яно апрацоўвае пераважную большасць звычайных выпадкаў выкарыстання з уражлівай дакладнасцю - робячы выдаленне фону даступным для ўсіх, а не толькі для экспертаў Photoshop.