Y Broblem
Mae'r hyn sy'n ymddangos yn syml i bobl - nodi "prif bwnc" llun - yn rhyfeddol o gymhleth i gyfrifiaduron. Dim ond grid o bicseli lliw yw delwedd. Nid oes label cynhenid yn dweud "y picsel hwn yw'r person" a "y picsel hwn yw'r wal y tu ôl iddynt."
Roedd dulliau traddodiadol yn defnyddio technegau fel trothwy lliw (tynnwch bob picsel o liw penodol) neu ganfod ymyl (dod o hyd i ffiniau rhwng gwrthrychau). Roedd y rhain yn gweithio ar gyfer achosion syml ond yn methu gyda golygfeydd cymhleth, lliwiau tebyg rhwng pwnc a chefndir, neu fanylion cymhleth.
Ewch i mewn i Ddysgu Peiriannau
Mae tynnu cefndir AI modern yn defnyddio dysgu dwfn - yn benodol, modelau segmentu delwedd. Dyma'r fersiwn symlach o sut mae'n gweithio:
1. Hyfforddiant
Dangosir miliynau o ddelweddau i rwydwaith niwral lle mae'r pwnc eisoes wedi'i adnabod â llaw (wedi'i labelu). Dros amser, mae'r model yn dysgu patrymau: sut olwg sydd ar bobl, sut mae gwrthrychau'n cael eu siapio, sut mae pynciau'n wahanol i gefndiroedd. Mae'n dysgu adnabod ymylon, gweadau a chyd-destun.
2. Casgliad (Defnyddio'r Model)
Pan fyddwch chi'n rhoi delwedd newydd i'r model hyfforddedig nad yw erioed wedi'i weld o'r blaen, mae'n dadansoddi'r data picsel ac yn cynhyrchu "mwgwd" - map sy'n pennu tebygolrwydd o fod yn flaendir (pwnc) neu gefndir i bob picsel. Cedwir picseli blaendir hyder uchel; mae picseli cefndir hyder uchel yn cael eu tynnu.
3. Trin Ymyl
Mae'r trawsnewid rhwng blaendir a chefndir yn hollbwysig. Mae modelau modern yn cynhyrchu ymylon meddal (tryloywder rhannol) yn hytrach na thoriadau deuaidd caled. Mae hyn yn creu canlyniadau sy'n edrych yn naturiol, yn enwedig o amgylch ymylon cymhleth.
Pam mae GPUs yn bwysig
Mae rhwydweithiau niwral yn prosesu delweddau trwy filoedd o weithrediadau mathemategol ar yr un pryd. Mae GPUs (Unedau Prosesu Graffeg) wedi'u cynllunio ar gyfer union y math hwn o gyfrifiant cyfochrog. Gall tasg a allai gymryd 30 eiliad ar CPU ei chwblhau mewn 2-3 eiliad ar GPU.
Dyma pam mae offer fel QuickRemove yn cefnogi cyflymiad GPU o GPUs NVIDIA, AMD, ac Intel. Mae'r model AI yn rhedeg yn uniongyrchol ar eich GPU ar gyfer prosesu cyflym. Os nad oes GPU cydnaws ar gael, mae'r feddalwedd yn disgyn yn ôl i brosesu CPU - mae'n dal i weithio, dim ond yn cymryd mwy o amser.
Beth Mae'r AI yn Dda
- Pobl a phortreadau—dyma’r achos defnydd mwyaf cyffredin, ac mae modelau wedi’u hyfforddi’n dda arno
- Anifeiliaid ac anifeiliaid anwes - mae modelau'n trin ffwr a siapiau anifeiliaid yn dda
- Cynhyrchion a gwrthrychau — gwrthrychau wedi'u diffinio'n dda gyda ffiniau clir
- Cerbydau — ceir, beiciau, a gwrthrychau tebyg
- Cefndiroedd cymhleth - gall yr AI wahanu pynciau oddi wrth gefndiroedd prysur, manwl
Heriau ar gyfer AI
- Gwrthrychau tryloyw - mae gwydr, dŵr, a deunyddiau tryloyw eraill yn anodd (mae QuickRemove yn cynnwys trin arbennig ar gyfer hyn)
- Tebygrwydd lliw - pan fo'r pwnc a'r cefndir yn debyg iawn o ran lliw, mae'n anoddach canfod ffiniau
- Golygfeydd hynod gymhleth — pynciau lluosog yn gorgyffwrdd neu flaendir/cefndir amwys
Ôl-Brosesu
Ar ôl i'r AI gynhyrchu'r mwgwd cychwynnol, mae ôl-brosesu yn mireinio'r canlyniad. Mae offer fel QuickRemove yn cynnig:
- Plu ymyl - meddalu'r trawsnewidiad rhwng pwnc a chefndir
- Llyfnhau - lleihau ymylon miniog
- Diheintio lliw — cael gwared ar arllwysiad lliw lle mae'r lliw cefndir gwreiddiol yn gwaedu ar ymylon y testun
- Brwsh llaw / rhwbiwr - ar gyfer cywiriadau mân y gallai'r AI eu methu
Y Llinell Isaf
Mae tynnu cefndir AI wedi cyrraedd pwynt lle mae'n cynhyrchu canlyniadau o ansawdd proffesiynol mewn eiliadau. Er nad yw'n berffaith ym mhob senario, mae'n trin y mwyafrif helaeth o achosion defnydd cyffredin gyda chywirdeb trawiadol - gan wneud tynnu cefndir yn hygyrch i bawb, nid arbenigwyr Photoshop yn unig.