பிரச்சனை
மனிதர்களுக்கு எளிமையானதாகத் தோன்றுவது - ஒரு புகைப்படத்தின் "முக்கிய விஷயத்தை" அடையாளம் காண்பது - கணினிகளுக்கு வியக்கத்தக்க வகையில் சிக்கலானது. ஒரு படம் என்பது வண்ண பிக்சல்களின் கட்டம் மட்டுமே. "இந்த பிக்சல் தான் நபர்" மற்றும் "இந்த பிக்சல் அவர்களுக்குப் பின்னால் உள்ள சுவர்" என்று எந்த உள்ளார்ந்த லேபிளும் இல்லை.
பாரம்பரிய அணுகுமுறைகள் வண்ண நுழைவு (ஒரு குறிப்பிட்ட நிறத்தின் அனைத்து பிக்சல்களையும் அகற்றுதல்) அல்லது விளிம்பு கண்டறிதல் (பொருட்களுக்கு இடையே உள்ள எல்லைகளைக் கண்டறிதல்) போன்ற நுட்பங்களைப் பயன்படுத்துகின்றன. இவை எளிய நிகழ்வுகளுக்கு வேலை செய்தாலும் சிக்கலான காட்சிகள், பொருள் மற்றும் பின்னணிக்கு இடையே ஒரே மாதிரியான வண்ணங்கள் அல்லது சிக்கலான விவரங்கள் ஆகியவற்றில் தோல்வியடைந்தன.
இயந்திர கற்றலை உள்ளிடவும்
நவீன AI பின்னணி நீக்கம் ஆழ்ந்த கற்றலைப் பயன்படுத்துகிறது - குறிப்பாக, படப் பிரிவு மாதிரிகள். இது எவ்வாறு செயல்படுகிறது என்பதற்கான எளிமையான பதிப்பு இங்கே:
1. பயிற்சி
ஒரு நரம்பியல் நெட்வொர்க் மில்லியன் கணக்கான படங்கள் காட்டப்படுகின்றன, அங்கு பொருள் ஏற்கனவே கைமுறையாக அடையாளம் காணப்பட்டது (லேபிளிடப்பட்டது). காலப்போக்கில், மாதிரி வடிவங்களைக் கற்றுக்கொள்கிறது: மக்கள் எப்படி இருக்கிறார்கள், பொருள்கள் எவ்வாறு வடிவமைக்கப்படுகின்றன, பின்னணியில் இருந்து பாடங்கள் எவ்வாறு வேறுபடுகின்றன. இது விளிம்புகள், கட்டமைப்புகள் மற்றும் சூழலை அடையாளம் காண கற்றுக்கொள்கிறது.
2. அனுமானம் (மாதிரியைப் பயன்படுத்துதல்)
பயிற்சியளிக்கப்பட்ட மாடலுக்கு இதுவரை பார்த்திராத புதிய படத்தைக் கொடுக்கும்போது, அது பிக்சல் தரவை பகுப்பாய்வு செய்து "முகமூடி"யை உருவாக்குகிறது - ஒவ்வொரு பிக்சலுக்கும் முன்புறம் (பொருள்) அல்லது பின்புலமாக இருப்பதற்கான நிகழ்தகவை வழங்கும் வரைபடம். உயர்-நம்பிக்கை முன்பக்கம் பிக்சல்கள் வைக்கப்படுகின்றன; உயர் நம்பிக்கை பின்னணி பிக்சல்கள் அகற்றப்பட்டன.
3. எட்ஜ் கையாளுதல்
முன்புறத்திற்கும் பின்னணிக்கும் இடையிலான மாற்றம் முக்கியமானது. நவீன மாதிரிகள் கடினமான பைனரி வெட்டுக்களைக் காட்டிலும் மென்மையான விளிம்புகளை (பகுதி வெளிப்படைத்தன்மை) உருவாக்குகின்றன. இது இயற்கையான தோற்றம் கொண்ட முடிவுகளை உருவாக்குகிறது, குறிப்பாக சிக்கலான விளிம்புகளைச் சுற்றி.
ஜிபியுக்கள் ஏன் முக்கியம்
நரம்பியல் நெட்வொர்க்குகள் ஒரே நேரத்தில் ஆயிரக்கணக்கான கணித செயல்பாடுகள் மூலம் படங்களை செயலாக்குகின்றன. GPUகள் (கிராபிக்ஸ் ப்ராசசிங் யூனிட்கள்) சரியாக இந்த வகையான இணையான கணக்கீடுகளுக்காக வடிவமைக்கப்பட்டுள்ளன. ஒரு CPU இல் 30 வினாடிகள் எடுக்கும் பணியை GPU இல் 2-3 வினாடிகளில் முடிக்க முடியும்.
இதனால்தான் QuickRemove போன்ற கருவிகள் NVIDIA, AMD மற்றும் Intel GPUகளில் இருந்து GPU முடுக்கத்தை ஆதரிக்கின்றன. விரைவான செயலாக்கத்திற்காக AI மாடல் உங்கள் GPU இல் நேரடியாக இயங்கும். இணக்கமான GPU கிடைக்கவில்லை என்றால், மென்பொருள் மீண்டும் CPU செயலாக்கத்திற்கு வரும் - இது இன்னும் வேலை செய்கிறது, அதிக நேரம் எடுக்கும்.
AI எதில் சிறந்தது
- மக்கள் மற்றும் உருவப்படங்கள் - இது மிகவும் பொதுவான பயன்பாடாகும், மேலும் மாதிரிகள் அதில் நன்கு பயிற்சி பெற்றவை
- விலங்குகள் மற்றும் செல்லப்பிராணிகள் - மாதிரிகள் ஃபர் மற்றும் விலங்கு வடிவங்களை நன்கு கையாளுகின்றன
- தயாரிப்புகள் மற்றும் பொருள்கள் — தெளிவான எல்லைகளுடன் நன்கு வரையறுக்கப்பட்ட பொருள்கள்
- வாகனங்கள் - கார்கள், பைக்குகள் மற்றும் ஒத்த பொருட்கள்
- சிக்கலான பின்னணிகள் - AI ஆனது பிஸியான, விரிவான பின்னணியில் இருந்து பாடங்களை பிரிக்க முடியும்
AIக்கான சவால்கள்
- வெளிப்படையான பொருள்கள் - கண்ணாடி, தண்ணீர் மற்றும் பிற வெளிப்படையான பொருட்கள் தந்திரமானவை (QuickRemove இதற்கான சிறப்பு கையாளுதலை உள்ளடக்கியது)
- வண்ண ஒற்றுமை - பொருளும் பின்னணியும் நிறத்தில் மிகவும் ஒத்ததாக இருக்கும்போது, எல்லைகளைக் கண்டறிவது கடினம்
- மிகவும் சிக்கலான காட்சிகள் — பல ஒன்றுடன் ஒன்று பாடங்கள் அல்லது தெளிவற்ற முன்புறம்/பின்னணி
பிந்தைய செயலாக்கம்
AI ஆரம்ப முகமூடியை உருவாக்கிய பிறகு, பிந்தைய செயலாக்கமானது முடிவைச் செம்மைப்படுத்துகிறது. QuickRemove சலுகை போன்ற கருவிகள்:
- விளிம்பு இறகு - பொருள் மற்றும் பின்னணிக்கு இடையே உள்ள மாற்றத்தை மென்மையாக்குகிறது
- மென்மையாக்குதல் - துண்டிக்கப்பட்ட விளிம்புகளைக் குறைத்தல்
- வண்ண தூய்மையாக்குதல் - அசல் பின்னணி வண்ணம் கருப்பொருளின் விளிம்புகளில் கசியும் வண்ணம் கசிவை நீக்குகிறது
- கையேடு தூரிகை/அழிப்பான் - சிறந்த திருத்தங்களுக்கு AI தவறவிடக்கூடும்
கீழ் வரி
AI பின்னணியை அகற்றுவது, சில நொடிகளில் தொழில்முறை-தரமான முடிவுகளை உருவாக்கும் ஒரு புள்ளியை எட்டியுள்ளது. ஒவ்வொரு சூழ்நிலையிலும் இது சரியானதாக இல்லாவிட்டாலும், ஃபோட்டோஷாப் வல்லுநர்கள் மட்டுமின்றி, பின்னணியை அகற்றும் அனைவருக்கும் அணுகக்கூடிய வகையில், பெரும்பாலான பொதுவான பயன்பாட்டு நிகழ்வுகளை ஈர்க்கக்கூடிய துல்லியத்துடன் இது கையாளுகிறது.