Kratak odgovor: Upscaling pomoću umjetne inteligencije funkcionira tako što se model obučava na uparenim slikama niske i visoke rezolucije, a zatim se koristi za predviđanje uvjerljivih dodatnih piksela tokom povećanja rezolucije. Ako je model vidio slične teksture ili lica tokom obuke, može dodati uvjerljive detalje; ako ne, može "halucinirati" artefakte poput oreola, voštane kože ili treperenja u videu.
Ključne zaključke:
Predviđanje : Model generira uvjerljive detalje, a ne zagarantovanu rekonstrukciju stvarnosti.
Izbor modela : CNN mreže su obično stabilnije; GAN mreže mogu izgledati oštrije, ali riskiraju izmišljanje novih funkcija.
Provjera artefakata : Pazite na oreole, ponovljene teksture, „skoro slova“ i plastična lica.
Stabilnost videa : Koristite vremenske metode ili ćete vidjeti treperenje i pomicanje od kadra do kadra.
Upotreba s visokim ulozima : Ako je tačnost bitna, otkrijte obradu i tretirajte rezultate kao ilustrativne.

Vjerovatno ste to vidjeli: mala, hrskava slika pretvara se u nešto dovoljno oštro da se odštampa, strimuje ili ubaci u prezentaciju bez trzanja. Osjeća se kao varanje. I - na najbolji način - nekako i jeste 😅
Dakle, kako funkcioniše AI Upscaling svodi se na nešto specifičnije od "računar poboljšava detalje" (talasasta ruka) i bliže je "modelu koji predviđa uvjerljivu strukturu visoke rezolucije na osnovu obrazaca koje je naučio iz mnogo primjera" ( Duboko učenje za superrezoluciju slike: Istraživanje ). Taj korak predviđanja je cijela igra - i zato AI upscaling može izgledati zapanjujuće... ili malo plastično... ili kao da je vašoj mački naraslo nekoliko dodatnih brkova.
Članci koje biste možda željeli pročitati nakon ovog:
🔗 Kako funkcioniše vještačka inteligencija
Naučite osnove modela, podataka i zaključivanja u umjetnoj inteligenciji.
🔗 Kako umjetna inteligencija uči
Pogledajte kako podaci o obuci i povratne informacije poboljšavaju performanse modela tokom vremena.
🔗 Kako umjetna inteligencija otkriva anomalije
Razumjeti osnovne obrasce i kako umjetna inteligencija brzo označava neobično ponašanje.
🔗 Kako umjetna inteligencija predviđa trendove
Istražite metode predviđanja koje uočavaju signale i predviđaju buduću potražnju.
Kako funkcioniše nadogradnja umjetne inteligencije: osnovna ideja, svakodnevnim riječima 🧩
Povećanje rezolucije znači povećanje rezolucije: više piksela, veća slika. Tradicionalno povećanje rezolucije (poput bikubičnog) u osnovi rasteže piksele i izglađuje prijelaze ( bikubična interpolacija ). U redu je, ali ne može izmisliti nove detalje - samo interpolira.
Povećanje skale umjetnom inteligencijom pokušava nešto smjelije (poznato kao "superrezolucija" u svijetu istraživanja) ( Duboko učenje za superrezoluciju slika: Istraživanje ):
-
Pregledava ulaz niske rezolucije
-
Prepoznaje uzorke (ivice, teksture, crte lica, poteze teksta, tkanje tkanine...)
-
bi trebala izgledati verzija veće rezolucije
-
Generira dodatne podatke piksela koji odgovaraju tim obrascima
Ne "savršeno vratiti stvarnost", već više kao "napraviti vrlo uvjerljivu pretpostavku" ( Slika Super-Rezolucija Korištenjem Dubokih Konvolucijskih Mreža (SRCNN) ). Ako vam to zvuči pomalo sumnjivo, niste u krivu - ali to je i razlog zašto tako dobro funkcionira 😄
I da, ovo znači da je povećanje skale pomoću umjetne inteligencije u osnovi kontrolirana halucinacija... ali na produktivan način koji poštuje piksele.
Šta čini dobru verziju AI nadogradnje? ✅🛠️
Ako ocjenjujete AI nadogradnju skale (ili unaprijed postavljenu postavku), evo šta je obično najvažnije:
-
Oporavak detalja bez prekuhavanja.
Dobro skaliranje dodaje hrskavost i strukturu, a ne hrskavi šum ili lažne pore. -
Disciplina na ivicama
Čiste linije ostaju čiste. Loši modeli uzrokuju klimanje ivica ili pojavu oreola. -
Realizam teksture
Kosa ne bi trebala postati potez kistom. Cigla ne bi trebala postati pečat s ponavljajućim uzorkom. -
Rukovanje šumom i kompresijom.
Mnoge svakodnevne slike su uništene u JPEG format. Dobar upscaler ne pojačava tu štetu ( Real-ESRGAN ). -
Svijest o licu i tekstu
Lica i tekst su najlakša mjesta za uočavanje grešaka. Dobri modeli se prema njima odnose nježno (ili imaju specijalizirane načine rada). -
Konzistentnost u svim kadrovima (za video)
Ako detalji trepere iz kadra u kadar, vaše oči će vrištati. Povećanje rezolucije videa živi ili umire vremenskom stabilnošću ( BasicVSR (CVPR 2021) ). -
Kontrole koje imaju smisla
Želite klizače koji daju stvarne rezultate: uklanjanje šuma, deblur, uklanjanje artefakata, zadržavanje zrna, oštrenje... praktične stvari.
Tiho pravilo koje i dalje važi: "najbolje" povećanje rezolucije je često ono koje jedva primijetite. Izgleda kao da ste od početka imali bolju kameru 📷✨
Tabela za poređenje: popularne opcije za povećanje skale umjetne inteligencije (i za šta su dobre) 📊🙂
Ispod je praktično poređenje. Cijene su namjerno nejasne jer se alati razlikuju po licenci, paketima, troškovima računarstva i svim tim zabavnim stvarima.
| Alat / Pristup | Najbolje za | Cijena | Zašto to funkcioniše (otprilike) |
|---|---|---|---|
| Topaz uređaji za povećanje rezolucije desktopa ( Topaz Photo , Topaz Video ) | Fotografije, video, jednostavan radni proces | Plaćeno | Snažni opći modeli + puno podešavanja, uglavnom "samo rade".. |
| Funkcije tipa Adobe „Super Resolution“ ( Adobe Enhance > Super Resolution ) | Fotografi koji su već u tom ekosistemu | Pretplata | Detaljna rekonstrukcija, obično konzervativna (manje dramatična) |
| Real-ESRGAN / ESRGAN varijante ( Real-ESRGAN , ESRGAN ) | Uradi sam, programeri, grupni poslovi | Besplatno (ali oduzima puno vremena) | Odlično za detalje teksture, može biti ljuto na licima ako niste oprezni |
| Režimi skaliranja zasnovani na difuziji ( SR3 ) | Kreativni rad, stilizirani rezultati | Mješovito | Može stvoriti prekrasne detalje - a može i izmisliti gluposti, tako da... da |
| Poboljšivači rezolucije za igre (DLSS/FSR stil) ( NVIDIA DLSS , AMD FSR 2 ) | Igranje i renderiranje u realnom vremenu | U paketu | Koristi podatke o kretanju i naučene prethodne vrijednosti - glatke performanse bolje 🕹️ |
| Usluge nadogradnje clouda | Praktičnost, brze pobjede | Plaćanje po korištenju | Brzo + skalabilno, ali žrtvujete kontrolu, a ponekad i suptilnost |
| AI nadogradnje videa fokusirane na video ( BasicVSR , Topaz Video ) | Stari snimci, anime, arhive | Plaćeno | Vremenski trikovi za smanjenje treperenja + specijalizirani video modeli |
| Povećanje rezolucije za "pametni" telefon/galeriju | Ležerna upotreba | Uključeno | Lagani modeli podešeni za zadovoljavajući rezultat, a ne za savršenstvo (i dalje praktični) |
Priznanje o neobičnom formatiranju: "Plaćeno" radi mnogo posla u toj tabeli. Ali shvatate poentu 😅
Velika tajna: modeli uče mapiranje od niske do visoke rezolucije 🧠➡️🖼️
U srži većine nadogradnji umjetne inteligencije nalazi se nadzirano učenje ( Superrezolucija slike korištenjem dubokih konvolucijskih mreža (SRCNN) ):
-
Počnite sa slikama visoke rezolucije („istina“)
-
Smanjite njihov broj uzorka na verzije niske rezolucije („ulaz“)
-
Trenirajte model za rekonstrukciju originalne visoke rezolucije iz niske rezolucije
Vremenom, model uči korelacije kao što su:
-
"Ova vrsta zamućenja oko oka obično pripada trepavicama"
-
„Ovaj skup piksela često označava serifni tekst“
-
„Ovaj gradijent ivice izgleda kao linija krova, a ne kao slučajna buka.“
Ne radi se o pamćenju specifičnih slika (u jednostavnom smislu), već o učenju statističke strukture ( Duboko učenje za superrezoluciju slika: Istraživanje ). Zamislite to kao učenje gramatike tekstura i ivica. Ne gramatika poezije, više kao... IKEA gramatika priručnika 🪑📦 (nespretna metafora, ali dovoljno blizu).
Osnovne stvari: šta se dešava tokom zaključivanja (kada povećavate skalu) ⚙️✨
Kada ubacite sliku u AI upscaler, obično postoji cjevovod poput ovog:
-
Prethodna obrada
-
Konvertujte prostor boja (ponekad)
-
Normalizujte vrijednosti piksela
-
Podijeli sliku na dijelove ako je velika (provjera realnosti VRAM-a 😭) ( Real-ESRGAN repozitorij (opcije podjele) )
-
-
Ekstrakcija karakteristika
-
Rani slojevi detektuju ivice, uglove, gradijente
-
Dublji slojevi detektuju obrasce: teksture, oblike, komponente lica
-
-
Rekonstrukcija
-
Model generira mapu karakteristika veće rezolucije
-
Zatim to pretvara u stvarni pikselni izlaz
-
-
Naknadna obrada
-
Opcionalno oštrenje
-
Opcionalno uklanjanje šuma
-
Opcionalno suzbijanje artefakata (zvonjenje, oreoli, blokovitost)
-
Jedan suptilni detalj: mnogi alati povećavaju veličinu pločica, a zatim spajaju spojeve. Odlični alati skrivaju granice pločica. Mehi alati ostavljaju slabe tragove mreže ako zažmirite. I da, zažmirit ćete, jer ljudi vole pregledavati sitne nesavršenosti pri zumu od 300% poput malih gremlina 🧌
Glavne porodice modela koje se koriste za povećanje skale vještačke inteligencije (i zašto se osjećaju drugačije) 🤖📚
1) Superrezolucija zasnovana na CNN-u (klasični radni konj)
Konvolucijske neuronske mreže su odlične za lokalne uzorke: rubove, teksture, male strukture ( Slika superrezolucije korištenjem dubokih konvolucijskih mreža (SRCNN) ).
-
Prednosti: donekle brz, stabilan, manje iznenađenja
-
Nedostaci: može izgledati malo "obrađeno" ako se previše pritisne
2) Upscaling zasnovan na GAN-u (u stilu ESRGAN-a) 🎭
GAN-ovi (generativne adverzijske mreže) obučavaju generator da proizvodi slike visoke rezolucije koje diskriminator ne može razlikovati od stvarnih ( generativne adverzijske mreže ).
-
Prednosti: upečatljivi detalji, impresivna tekstura
-
Nedostaci: mogu izmisliti detalje kojih nije bilo - ponekad pogrešno, ponekad neobično ( SRGAN , ESRGAN )
GAN vam može dati onu oštrinu koja oduzima dah. Također može dati vašem portretu dodatnu obrvu. Zato... birajte svoje bitke 😬
3) Povećanje skale zasnovano na difuziji (kreativni džoker) 🌫️➡️🖼️
Difuzijski modeli uklanjaju šum korak po korak i mogu se voditi kako bi se dobili detalji visoke rezolucije ( SR3 ).
-
Prednosti: može biti nevjerovatno dobar u uvjerljivim detaljima, posebno za kreativni rad
-
Nedostaci: može se udaljiti od originalnog identiteta/strukture ako su postavke agresivne ( SR3 )
Ovdje se "upscaling" počinje stapati s "reimaginingom". Ponekad je to upravo ono što želite. Ponekad nije.
4) Povećanje rezolucije videa s vremenskom konzistentnošću 🎞️
Povećanje rezolucije videa često dodaje logiku svjesnu pokreta:
-
Koristi susjedne kadrove za stabilizaciju detalja ( BasicVSR (CVPR 2021) )
-
Pokušava izbjeći treperenje i puzeće artefakte
-
Često kombinuje superrezoluciju sa uklanjanjem šuma i deinterlacingom ( Topaz Video )
Ako je povećanje rezolucije slike kao restauracija jedne slike, povećanje rezolucije videa je kao restauracija flipbooka bez promjene oblika nosa lika na svakoj stranici. Što je... teže nego što zvuči.
Zašto povećanje skale pomoću umjetne inteligencije ponekad izgleda lažno (i kako to prepoznati) 👀🚩
Unapgradeing AI-a ne uspijeva na prepoznatljive načine. Kada jednom naučite obrasce, vidjet ćete ih svugdje, kao što je kupovina novog automobila i iznenada primjećivanje tog modela u svakoj ulici 😵💫
Uobičajene poruke:
-
Depilacija lica voskom (previše uklanjanja šuma + zaglađivanja)
-
Preoštreni oreoli oko ivica (klasična teritorija "prekoračenja") ( bikubna interpolacija )
-
Ponavljane teksture (zidovi od cigle postaju kopirani i zalijepljeni uzorci)
-
Hrskavi mikrokontrast koji odaje utisak "algoritam"
-
Iskrivljavanje teksta gdje slova postaju gotovo slova (najgora vrsta)
-
Pomjeranje detalja gdje se male karakteristike suptilno mijenjaju, posebno u difuzijskim radnim procesima ( SR3 )
Nezgodno je: ponekad ovi artefakti izgledaju "bolje" na prvi pogled. Vaš mozak voli oštrinu. Ali nakon trenutka, osjeća se... čudno.
Dobra taktika je zumirati i provjeriti da li izgleda prirodno na normalnoj udaljenosti gledanja. Ako izgleda dobro samo pri zumu od 400%, to nije pobjeda, to je hobi 😅
Kako funkcioniše nadogradnja umjetne inteligencije: strana obuke, bez matematičke glavobolje 📉🙂
Treniranje modela superrezolucije obično uključuje:
-
Upareni skupovi podataka (ulaz niske rezolucije, cilj visoke rezolucije) ( Slika superrezolucije korištenjem dubokih konvolucijskih mreža (SRCNN) )
-
Funkcije gubitka koje kažnjavaju pogrešne rekonstrukcije ( SRGAN )
Tipične vrste gubitaka:
-
Gubitak piksela (L1/L2)
Podstiče tačnost. Može dati malo meke rezultate. -
Perceptivni gubitak
Poredi dublje karakteristike (poput „da li ovo izgleda slično“) umjesto tačnih piksela ( Perceptivni gubici (Johnson et al., 2016) ). -
Nesuparnički gubitak (GAN)
Podstiče realizam, ponekad na štetu doslovne tačnosti ( SRGAN , Generativne suparničke mreže ).
Stalno se vodi natezanje konopa:
-
Učinite ga vjernim originalu u
odnosu na -
Učinite to vizualno ugodnim
Različiti alati zauzimaju različita mjesta na tom spektru. I možda ćete preferirati jedan ovisno o tome da li restaurirate porodične fotografije ili pripremate poster gdje je "lijep izgled" važniji od forenzičke tačnosti.
Praktični tokovi rada: fotografije, stari skenovi, anime i video 📸🧾🎥
Fotografije (portreti, pejzaži, fotografije proizvoda)
Najbolja praksa je obično:
-
Prvo blago uklanjanje šuma (ako je potrebno)
-
Luksuzno s konzervativnim postavkama
-
Dodajte zrnastu teksturu ako vam se čini da je previše glatka (da, zaista)
Žitarice su kao sol. Previše ih pokvari večeru, ali ništa ne može biti malo bezukusno 🍟
Stari skenovi i jako komprimirane slike
Ovo je teže jer model može tretirati blokove kompresije kao "teksturu".
Pokušajte:
-
Uklanjanje ili deblokiranje artefakata
-
Zatim nadogradnja
-
Zatim lagano oštrenje (ne previše... Znam, svi to kažu, ali ipak)
Anime i linijska umjetnost
Prednosti linijske umjetnosti su:
-
Modeli koji održavaju čiste rubove
-
Smanjena halucinacija teksture.
Povećanje skale u animeu često izgleda sjajno jer su oblici jednostavniji i konzistentniji. (Sretno.)
Videozapis
Video dodaje dodatne korake:
-
Uklanjanje šuma
-
Deinterlace (za određene izvore)
-
Luksuzno
-
Vremensko zaglađivanje ili stabilizacija ( BasicVSR (CVPR 2021) )
-
Opcionalno ponovno uvođenje zrna radi kohezije
Ako preskočite vremensku konzistentnost, dobit ćete to svjetlucavo treperenje detalja. Kad ga jednom primijetite, ne možete ga ne vidjeti. Kao škripava stolica u tihoj sobi 😖
Odabir postavki bez previše nagađanja (mali varalica) 🎛️😵💫
Evo jednog pristojnog početnog načina razmišljanja:
-
Ako lica izgledaju plastično,
smanjite šum, smanjite izoštravanje i isprobajte model ili način rada koji čuva lica. -
Ako teksture izgledaju previše intenzivno,
smanjite klizače za „poboljšanje detalja“ ili „obnavljanje detalja“, a zatim dodajte suptilnu zrnatost. -
Ako rubovi svijetle,
smanjite oštrenje i provjerite opcije za suzbijanje oreola. -
Ako slika izgleda previše "AI" (umjetna inteligencija),
budite konzervativniji. Ponekad je najbolji potez jednostavno... manje.
Također: nemojte povećavati skalu na 8x samo zato što možete. Čisto 2x ili 4x je često idealna kombinacija. Nakon toga, tražite od modela da piše fanfikciju o vašim pikselima 📖😂
Etika, autentičnost i neugodno pitanje "istine" 🧭😬
Povećanje skale pomoću umjetne inteligencije zamagljuje granicu:
-
Restauracija podrazumijeva vraćanje onoga što je bilo tamo
-
Poboljšanje podrazumijeva dodavanje onoga što nije bilo
Sa ličnim fotografijama, obično je u redu (i lijepo). Sa novinarstvom, pravnim dokazima, medicinskim snimanjem ili bilo čim gdje je vjernost bitna... morate biti oprezni ( OSAC/NIST: Standardni vodič za upravljanje forenzičkim digitalnim slikama , SWGDE smjernice za forenzičku analizu slika ).
Jednostavno pravilo:
-
Ako su ulozi visoki, tretirajte povećanje skale umjetne inteligencije kao ilustraciju , a ne kao konačno rješenje.
Također, otkrivanje informacija je važno u profesionalnom kontekstu. Ne zato što je vještačka inteligencija zlo, već zato što publika zaslužuje znati jesu li detalji rekonstruirani ili snimljeni. To je jednostavno... s poštovanjem.
Završne bilješke i kratki pregled 🧡✅
Dakle, kako funkcioniše AI Upscaling (upscaling) je sljedeći: modeli uče kako se detalji visoke rezolucije odnose na uzorke niske rezolucije, a zatim predviđaju uvjerljive dodatne piksele tokom upscalinga ( Duboko učenje za superrezoluciju slike: Istraživanje ). Ovisno o porodici modela (CNN, GAN, difuzija, video-temporalni), to predviđanje može biti konzervativno i vjerno... ili smjelo i ponekad neuravnoteženo 😅
Kratak pregled
-
Tradicionalno povećanje skale rasteže piksele ( bikubična interpolacija )
-
Povećanje skale pomoću umjetne inteligencije predviđa nedostajuće detalje koristeći naučene obrasce ( Superrezolucija slike korištenjem dubokih konvolucijskih mreža (SRCNN) )
-
Odlični rezultati dolaze s pravim modelom + ograničenjem
-
Pazite na oreole, voštane površine, ponavljajuće teksture i treperenje u videu ( BasicVSR (CVPR 2021) )
-
Povećanje razmjera je često „vjerovatna rekonstrukcija“, a ne savršena istina ( SRGAN , ESRGAN )
Ako želiš, reci mi šta uvećavaš (lica, stare fotografije, video, anime, skeniranje teksta), a ja ću ti predložiti strategiju postavki koja će izbjeći uobičajene greške "AI izgleda" 🎯🙂
Često postavljana pitanja
Povećanje skale umjetne inteligencije i kako ono funkcionira
Povećanje rezolucije pomoću vještačke inteligencije (često nazivano "super-rezolucija") povećava rezoluciju slike predviđanjem nedostajućih detalja visoke rezolucije iz obrazaca naučenih tokom obuke. Umjesto jednostavnog rastezanja piksela poput bikubične interpolacije, model proučava rubove, teksture, lica i poteze slične tekstu, a zatim generira nove podatke piksela koji se slažu s tim naučenim obrascima. To je manje "vraćanje stvarnosti", a više "pravljenje uvjerljive pretpostavke" koja se čita kao prirodna.
Povećanje veličine pomoću umjetne inteligencije u odnosu na bikubičnu ili tradicionalnu promjenu veličine
Tradicionalne metode skaliranja (poput bikubičnog) uglavnom interpoliraju između postojećih piksela, izglađujući prijelaze bez stvaranja novih detalja. AI skaliranje ima za cilj rekonstruirati vjerodostojnu strukturu prepoznavanjem vizualnih znakova i predviđanjem kako će izgledati verzije tih znakova u visokoj rezoluciji. Zato se rezultati umjetne inteligencije mogu činiti dramatično oštrijima, a također i zato mogu uvesti artefakte ili "izmisliti" detalje koji nisu bili prisutni u izvoru.
Zašto lica mogu izgledati voštano ili previše glatko
Voštana lica obično nastaju agresivnim uklanjanjem šuma i zaglađivanjem u kombinaciji s oštrenjem koje uklanja prirodnu teksturu kože. Mnogi alati tretiraju šum i finu teksturu na sličan način, tako da "čišćenje" slike može izbrisati pore i suptilne detalje. Uobičajeni pristup je smanjenje uklanjanja šuma i oštrenja, korištenje načina očuvanja lica ako je dostupan, a zatim ponovno uvođenje malo zrnatosti kako bi rezultat djelovao manje plastično i više fotografski.
Uobičajeni artefakti skaliranja umjetne inteligencije na koje treba obratiti pažnju
Tipični znaci uključuju oreole oko ivica, ponavljajuće teksturne uzorke (poput cigli koje se kopiraju i lijepe), hrskavi mikrokontrast i tekst koji se pretvara u „skoro slova“. U radnim procesima zasnovanim na difuziji, također možete vidjeti pomicanje detalja gdje se male karakteristike suptilno mijenjaju. Za video, treperenje i puzanje detalja po kadrovima su veliki znakovi upozorenja. Ako izgleda dobro samo pri ekstremnom zumu, postavke su vjerovatno previše agresivne.
Kako se GAN, CNN i difuzijski upscaleri obično razlikuju u rezultatima
Superrezolucija zasnovana na CNN-u obično je stabilnija i predvidljivija, ali može izgledati "obrađeno" ako se previše forsira. Opcije zasnovane na GAN-u (ESRGAN stil) često proizvode snažniju teksturu i percipiranu oštrinu, ali mogu halucinirati netačne detalje, posebno na licima. Povećanje skale zasnovano na difuziji može generirati prekrasne, uvjerljive detalje, ali se mogu odmaknuti od originalne strukture ako su postavke smjernica ili jačine prejake.
Praktična strategija podešavanja za izbjegavanje izgleda „previše umjetne inteligencije“
Počnite konzervativno: povećajte skalu 2× ili 4× prije nego što posegnete za ekstremnim faktorima. Ako lica izgledaju plastično, smanjite šum i izoštravanje te isprobajte način rada koji je svjesni lica. Ako teksture postanu previše intenzivne, smanjite poboljšanje detalja i nakon toga razmislite o dodavanju suptilne zrnatosti. Ako rubovi sjaje, smanjite izoštravanje i provjerite suzbijanje oreola ili artefakata. U mnogim protocima, "manje" pobjeđuje jer čuva uvjerljiv realizam.
Obrada starih skeniranih slika ili slika sa visokim JPEG komprimovanjem prije povećanja rezolucije
Komprimirane slike su nezgodne jer modeli mogu tretirati blokovske artefakte kao stvarnu teksturu i pojačati ih. Uobičajeni tijek rada je prvo uklanjanje ili deblokiranje artefakata, zatim povećanje skale, a na kraju samo lagano izoštravanje ako je potrebno. Kod skeniranja, nježno čišćenje može pomoći modelu da se fokusira na stvarnu strukturu, a ne na oštećenja. Cilj je smanjiti "lažne znakove teksture" tako da osoba koja vrši povećanje skale ne mora donositi samouvjerene zaključke na osnovu šumnih ulaza.
Zašto je povećanje rezolucije videa teže od povećanja rezolucije fotografija
Povećavanje rezolucije videa mora biti konzistentno u svim kadrovima, ne samo dobro na jednoj statičnoj slici. Ako detalji trepere od kadra do kadra, rezultat brzo postaje ometajući. Pristupi usmjereni na video koriste vremenske informacije iz susjednih kadrova kako bi stabilizirali rekonstrukciju i izbjegli svjetlucave artefakte. Mnogi tokovi rada također uključuju uklanjanje šuma, uklanjanje ispreplitanja za određene izvore i opcionalno ponovno uvođenje zrnatosti tako da cijela sekvenca djeluje kohezivno, a ne vještački oštro.
Kada povećanje skale pomoću vještačke inteligencije nije prikladno ili je rizično oslanjati se na njega
Povećanje skale pomoću umjetne inteligencije (AI) najbolje je tretirati kao poboljšanje, a ne kao dokaz. U kontekstima visokog rizika poput novinarstva, pravnih dokaza, medicinskog snimanja ili forenzičkog rada, generiranje „vjerodostojnih“ piksela može zavarati jer može dodati detalje koji nisu zabilježeni. Sigurnije uokviravanje je koristiti ga ilustrativno i otkriti da je AI procesom rekonstruirao detalje. Ako je vjernost kritična, sačuvajte originale i dokumentirajte svaki korak obrade i postavku.
Reference
-
arXiv - Duboko učenje za superrezoluciju slika: Istraživanje - arxiv.org
-
arXiv - Superrezolucija slike korištenjem dubokih konvolucijskih mreža (SRCNN) - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
NVIDIA programer - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Otvoreni pristup Fondacije za računarski vid (CVF) - BasicVSR: Potraga za esencijalnim komponentama u video superrezoluciji (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Generativne suparničke mreže - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Perceptivni gubici (Johnson i dr., 2016) - arxiv.org
-
GitHub - Real-ESRGAN repozitorij (opcije pločica) - github.com
-
Wikipedia - Bikubična interpolacija - wikipedia.org
-
Topaz Labs - Topaz Photo - topazlabs.com
-
Topaz Labs - Topaz Video - topazlabs.com
-
Adobe centar za pomoć - Adobe Enhance > Super rezolucija - helpx.adobe.com
-
NIST / OSAC - Standardni vodič za upravljanje forenzičkim digitalnim slikama (verzija 1.0) - nist.gov
-
SWGDE - Smjernice za forenzičku analizu slika - swgde.org