ਸਮੱਸਿਆ
ਜੋ ਮਨੁੱਖਾਂ ਲਈ ਸਧਾਰਨ ਜਾਪਦਾ ਹੈ - ਇੱਕ ਫੋਟੋ ਦੇ "ਮੁੱਖ ਵਿਸ਼ੇ" ਦੀ ਪਛਾਣ ਕਰਨਾ - ਕੰਪਿਊਟਰਾਂ ਲਈ ਹੈਰਾਨੀਜਨਕ ਤੌਰ 'ਤੇ ਗੁੰਝਲਦਾਰ ਹੈ। ਇੱਕ ਚਿੱਤਰ ਸਿਰਫ ਰੰਗੀਨ ਪਿਕਸਲ ਦਾ ਇੱਕ ਗਰਿੱਡ ਹੈ। "ਇਹ ਪਿਕਸਲ ਉਹ ਵਿਅਕਤੀ ਹੈ" ਅਤੇ "ਇਹ ਪਿਕਸਲ ਉਹਨਾਂ ਦੇ ਪਿੱਛੇ ਦੀਵਾਰ ਹੈ" ਕਹਿਣ ਵਾਲਾ ਕੋਈ ਅੰਦਰੂਨੀ ਲੇਬਲ ਨਹੀਂ ਹੈ।
ਰਵਾਇਤੀ ਪਹੁੰਚ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਜਿਵੇਂ ਕਿ ਰੰਗ ਥ੍ਰੈਸ਼ਹੋਲਡਿੰਗ (ਇੱਕ ਖਾਸ ਰੰਗ ਦੇ ਸਾਰੇ ਪਿਕਸਲ ਨੂੰ ਹਟਾਓ) ਜਾਂ ਕਿਨਾਰੇ ਦੀ ਖੋਜ (ਆਬਜੈਕਟ ਵਿਚਕਾਰ ਸੀਮਾਵਾਂ ਲੱਭੋ)। ਇਹ ਸਧਾਰਨ ਕੇਸਾਂ ਲਈ ਕੰਮ ਕਰਦੇ ਹਨ ਪਰ ਗੁੰਝਲਦਾਰ ਦ੍ਰਿਸ਼ਾਂ, ਵਿਸ਼ੇ ਅਤੇ ਪਿਛੋਕੜ ਦੇ ਵਿਚਕਾਰ ਸਮਾਨ ਰੰਗ, ਜਾਂ ਗੁੰਝਲਦਾਰ ਵੇਰਵਿਆਂ ਨਾਲ ਅਸਫਲ ਰਹੇ।
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਦਾਖਲ ਹੋਵੋ
ਆਧੁਨਿਕ AI ਬੈਕਗਰਾਊਂਡ ਰਿਮੂਵਲ ਡੂੰਘੀ ਸਿਖਲਾਈ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ — ਖਾਸ ਤੌਰ 'ਤੇ, ਚਿੱਤਰ ਸੈਗਮੈਂਟੇਸ਼ਨ ਮਾਡਲ। ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ ਇਸਦਾ ਸਰਲ ਰੂਪ ਹੈ:
1. ਸਿਖਲਾਈ
ਇੱਕ ਨਿਊਰਲ ਨੈਟਵਰਕ ਲੱਖਾਂ ਚਿੱਤਰਾਂ ਨੂੰ ਦਿਖਾਇਆ ਗਿਆ ਹੈ ਜਿੱਥੇ ਵਿਸ਼ੇ ਨੂੰ ਪਹਿਲਾਂ ਹੀ ਹੱਥੀਂ ਪਛਾਣਿਆ ਗਿਆ ਹੈ (ਲੇਬਲ ਕੀਤਾ ਗਿਆ ਹੈ)। ਸਮੇਂ ਦੇ ਨਾਲ, ਮਾਡਲ ਪੈਟਰਨ ਸਿੱਖਦਾ ਹੈ: ਲੋਕ ਕਿਹੋ ਜਿਹੇ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ, ਵਸਤੂਆਂ ਦਾ ਆਕਾਰ ਕਿਵੇਂ ਹੁੰਦਾ ਹੈ, ਵਿਸ਼ੇ ਪਿਛੋਕੜ ਤੋਂ ਕਿਵੇਂ ਵੱਖਰੇ ਹੁੰਦੇ ਹਨ। ਇਹ ਕਿਨਾਰਿਆਂ, ਟੈਕਸਟ ਅਤੇ ਸੰਦਰਭ ਨੂੰ ਪਛਾਣਨਾ ਸਿੱਖਦਾ ਹੈ।
2. ਅਨੁਮਾਨ (ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨਾ)
ਜਦੋਂ ਤੁਸੀਂ ਸਿਖਿਅਤ ਮਾਡਲ ਨੂੰ ਇੱਕ ਨਵਾਂ ਚਿੱਤਰ ਦਿੰਦੇ ਹੋ ਜਿਸ ਨੇ ਪਹਿਲਾਂ ਕਦੇ ਨਹੀਂ ਦੇਖਿਆ, ਇਹ ਪਿਕਸਲ ਡੇਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ ਅਤੇ ਇੱਕ "ਮਾਸਕ" ਬਣਾਉਂਦਾ ਹੈ - ਇੱਕ ਨਕਸ਼ਾ ਜੋ ਹਰੇਕ ਪਿਕਸਲ ਨੂੰ ਫੋਰਗਰਾਉਂਡ (ਵਿਸ਼ੇ) ਜਾਂ ਬੈਕਗ੍ਰਾਉਂਡ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ। ਉੱਚ-ਵਿਸ਼ਵਾਸ ਫੋਰਗਰਾਉਂਡ ਪਿਕਸਲ ਰੱਖੇ ਜਾਂਦੇ ਹਨ; ਉੱਚ-ਵਿਸ਼ਵਾਸ ਵਾਲੇ ਬੈਕਗ੍ਰਾਊਂਡ ਪਿਕਸਲ ਹਟਾਏ ਜਾਂਦੇ ਹਨ।
3. ਕਿਨਾਰੇ ਨੂੰ ਸੰਭਾਲਣਾ
ਫੋਰਗਰਾਉਂਡ ਅਤੇ ਬੈਕਗ੍ਰਾਉਂਡ ਵਿਚਕਾਰ ਤਬਦੀਲੀ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਆਧੁਨਿਕ ਮਾਡਲ ਸਖ਼ਤ ਬਾਈਨਰੀ ਕੱਟਾਂ ਦੀ ਬਜਾਏ ਨਰਮ ਕਿਨਾਰੇ (ਅੰਸ਼ਕ ਪਾਰਦਰਸ਼ਤਾ) ਪੈਦਾ ਕਰਦੇ ਹਨ। ਇਹ ਕੁਦਰਤੀ ਦਿੱਖ ਵਾਲੇ ਨਤੀਜੇ ਬਣਾਉਂਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਗੁੰਝਲਦਾਰ ਕਿਨਾਰਿਆਂ ਦੇ ਆਲੇ ਦੁਆਲੇ।
GPU ਮਾਇਨੇ ਕਿਉਂ ਰੱਖਦੇ ਹਨ
ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਹਜ਼ਾਰਾਂ ਗਣਿਤਿਕ ਕਾਰਵਾਈਆਂ ਰਾਹੀਂ ਇੱਕੋ ਸਮੇਂ ਚਿੱਤਰਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਦੇ ਹਨ। GPUs (ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ) ਬਿਲਕੁਲ ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਸਮਾਨਾਂਤਰ ਗਣਨਾ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ। ਇੱਕ ਕੰਮ ਜੋ ਇੱਕ CPU 'ਤੇ 30 ਸਕਿੰਟ ਲੈ ਸਕਦਾ ਹੈ, ਇੱਕ GPU 'ਤੇ 2-3 ਸਕਿੰਟਾਂ ਵਿੱਚ ਪੂਰਾ ਹੋ ਸਕਦਾ ਹੈ।
ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ QuickRemove ਵਰਗੇ ਟੂਲ NVIDIA, AMD, ਅਤੇ Intel GPUs ਤੋਂ GPU ਪ੍ਰਵੇਗ ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ। AI ਮਾਡਲ ਤੇਜ਼ ਪ੍ਰਕਿਰਿਆ ਲਈ ਸਿੱਧੇ ਤੁਹਾਡੇ GPU 'ਤੇ ਚੱਲਦਾ ਹੈ। ਜੇਕਰ ਕੋਈ ਅਨੁਕੂਲ GPU ਉਪਲਬਧ ਨਹੀਂ ਹੈ, ਤਾਂ ਸੌਫਟਵੇਅਰ CPU ਪ੍ਰੋਸੈਸਿੰਗ 'ਤੇ ਵਾਪਸ ਆ ਜਾਂਦਾ ਹੈ — ਇਹ ਅਜੇ ਵੀ ਕੰਮ ਕਰਦਾ ਹੈ, ਬੱਸ ਜ਼ਿਆਦਾ ਸਮਾਂ ਲੈਂਦਾ ਹੈ।
AI ਕਿਸ ਚੀਜ਼ ਵਿੱਚ ਚੰਗਾ ਹੈ
- ਲੋਕ ਅਤੇ ਪੋਰਟਰੇਟ — ਇਹ ਸਭ ਤੋਂ ਆਮ ਵਰਤੋਂ ਦਾ ਮਾਮਲਾ ਹੈ, ਅਤੇ ਮਾਡਲ ਇਸ 'ਤੇ ਚੰਗੀ ਤਰ੍ਹਾਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਨ
- ਜਾਨਵਰ ਅਤੇ ਪਾਲਤੂ ਜਾਨਵਰ - ਮਾਡਲ ਫਰ ਅਤੇ ਜਾਨਵਰਾਂ ਦੇ ਆਕਾਰ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਸੰਭਾਲਦੇ ਹਨ
- ਉਤਪਾਦ ਅਤੇ ਵਸਤੂਆਂ — ਸਪਸ਼ਟ ਸੀਮਾਵਾਂ ਦੇ ਨਾਲ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਰਿਭਾਸ਼ਿਤ ਵਸਤੂਆਂ
- ਵਾਹਨ — ਕਾਰਾਂ, ਬਾਈਕ, ਅਤੇ ਸਮਾਨ ਚੀਜ਼ਾਂ
- ਗੁੰਝਲਦਾਰ ਪਿਛੋਕੜ - AI ਵਿਸ਼ਿਆਂ ਨੂੰ ਵਿਅਸਤ, ਵਿਸਤ੍ਰਿਤ ਪਿਛੋਕੜ ਤੋਂ ਵੱਖ ਕਰ ਸਕਦਾ ਹੈ
AI ਲਈ ਚੁਣੌਤੀਆਂ
- ਪਾਰਦਰਸ਼ੀ ਵਸਤੂਆਂ — ਕੱਚ, ਪਾਣੀ, ਅਤੇ ਹੋਰ ਦੇਖਣ ਵਾਲੀ ਸਮੱਗਰੀ ਔਖੀ ਹੈ (QuickRemove ਵਿੱਚ ਇਸਦੇ ਲਈ ਵਿਸ਼ੇਸ਼ ਹੈਂਡਲਿੰਗ ਸ਼ਾਮਲ ਹੈ)
- ਰੰਗ ਸਮਾਨਤਾ — ਜਦੋਂ ਵਿਸ਼ਾ ਅਤੇ ਬੈਕਗ੍ਰਾਊਂਡ ਰੰਗ ਵਿੱਚ ਬਹੁਤ ਸਮਾਨ ਹੁੰਦੇ ਹਨ, ਸੀਮਾਵਾਂ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਔਖਾ ਹੁੰਦਾ ਹੈ
- ਬਹੁਤ ਹੀ ਗੁੰਝਲਦਾਰ ਦ੍ਰਿਸ਼ — ਮਲਟੀਪਲ ਓਵਰਲੈਪਿੰਗ ਵਿਸ਼ੇ ਜਾਂ ਅਸਪਸ਼ਟ ਫੋਰਗਰਾਉਂਡ/ਬੈਕਗ੍ਰਾਊਂਡ
ਪੋਸਟ-ਪ੍ਰੋਸੈਸਿੰਗ
AI ਦੁਆਰਾ ਸ਼ੁਰੂਆਤੀ ਮਾਸਕ ਤਿਆਰ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਪੋਸਟ-ਪ੍ਰੋਸੈਸਿੰਗ ਨਤੀਜੇ ਨੂੰ ਸ਼ੁੱਧ ਕਰਦੀ ਹੈ। ਟੂਲ ਜਿਵੇਂ ਕਿ QuickRemove ਪੇਸ਼ਕਸ਼:
- ਕਿਨਾਰੇ ਦੇ ਖੰਭ - ਵਿਸ਼ੇ ਅਤੇ ਪਿਛੋਕੜ ਵਿਚਕਾਰ ਤਬਦੀਲੀ ਨੂੰ ਨਰਮ ਕਰਨਾ
- ਸਮੂਥਿੰਗ — ਜਾਗ ਵਾਲੇ ਕਿਨਾਰਿਆਂ ਨੂੰ ਘਟਾਉਣਾ
- ਰੰਗ ਰੋਗ-ਨਿਰਮਾਣ - ਰੰਗ ਦੇ ਛਿੱਟੇ ਨੂੰ ਹਟਾਉਣਾ ਜਿੱਥੇ ਅਸਲ ਪਿਛੋਕੜ ਦਾ ਰੰਗ ਵਿਸ਼ੇ ਦੇ ਕਿਨਾਰਿਆਂ 'ਤੇ ਵਗਦਾ ਹੈ
- ਮੈਨੁਅਲ ਬੁਰਸ਼/ਇਰੇਜ਼ਰ — ਵਧੀਆ ਸੁਧਾਰਾਂ ਲਈ AI ਖੁੰਝ ਸਕਦਾ ਹੈ
ਹੇਠਲੀ ਲਾਈਨ
AI ਪਿਛੋਕੜ ਨੂੰ ਹਟਾਉਣਾ ਇੱਕ ਬਿੰਦੂ 'ਤੇ ਪਹੁੰਚ ਗਿਆ ਹੈ ਜਿੱਥੇ ਇਹ ਸਕਿੰਟਾਂ ਵਿੱਚ ਪੇਸ਼ੇਵਰ-ਗੁਣਵੱਤਾ ਦੇ ਨਤੀਜੇ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਹਾਲਾਂਕਿ ਇਹ ਹਰ ਸਥਿਤੀ ਵਿੱਚ ਸੰਪੂਰਨ ਨਹੀਂ ਹੈ, ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਆਮ ਵਰਤੋਂ ਦੇ ਬਹੁਤ ਸਾਰੇ ਮਾਮਲਿਆਂ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ — ਬੈਕਗ੍ਰਾਉਂਡ ਹਟਾਉਣ ਨੂੰ ਹਰ ਕਿਸੇ ਲਈ ਪਹੁੰਚਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਨਾ ਕਿ ਸਿਰਫ ਫੋਟੋਸ਼ਾਪ ਮਾਹਰਾਂ ਲਈ।