Restarting the experience
ឈ្វេងយល់ពីដំណើរការក្លែងបន្លំជ្រៅ និងតម្រុយសោទស្សន៍ដែលអ្នកអាចប្រើដើម្បីកំណត់អត្តសញ្ញាណពួកវា តាមរយៈរឿងរ៉ាវនៃការស្រាវជ្រាវ និងឧទាហរណ៍ពីទូទាំងបណ្តាញអ៊ីនធឺណិត។
នៅក្នុងវីដេអូនេះ មុខរបស់ទារកត្រូវបានយកទៅដាក់លើមុខលោក Elon Musk ។ ប្រភេទនៃការប្តូរមុខនេះគឺជាការប្រើញឹកញាប់បំផុតនៃការក្លែងបន្លំជ្រៅ (deepfakes)។ មើលឱ្យជិត៖ ជ្រុងមុខក៏មិនត្រូវគ្នា ហើយពណ៌ស្បែកក៏ខុសគ្នា។
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ចំណុចសង្ស័យ៖
ពណ៌ស្បែកមិនត្រូវគ្នា៖ មានភាពខុសគ្នានៃពណ៌ស្បែករវាងមុខដើម និងមុខដែលដាក់ត្រួតបន្ស៊ី។ មុខហាក់ដូចជាត្រូវបានគ្របដោយស្រទាប់ពណ៌ បង្ហាញគែម ឬចំណុច។
ការរក្លែងបន្លំជ្រៅត្រូវបានបង្កើតឡើងដោយកម្មវិធីកុំព្យូទ័រដែលអាចបង្រៀនខ្លួនឯងពីរបៀបបង្កើតមុខឡើងវិញដោយការវិភាគរូបភាពជាច្រើនរបស់មនុស្ស។ បន្ទាប់មក កម្មវិធីនេះនឹងត្រួតបន្ស៊ីគ្នាលើមុខដែលវាបានបង្កើតឡើងវិញនៅលើវីដេអូដែលមានស្រាប់ - ដូចជាម៉ាស់ឌីជីថល។ អ្នកអាចឃើញដាននៃម៉ាស់បែបនេះនៅក្នុងវីដេអូនេះ៖
Target Video
Deepfaked Video
វីដេអូគោលដៅការក្លែងបន្លំជ្រៅ៖ YouTube | AndrewSchrock | Cutest Baby Montage Ever.
ប្រភពវីដេអូរក្លែងបន្លំជ្រៅ៖ YouTube | TheFakening | Baby Elon Musk Montage Deepfake
វីដេអូក្លែងបន្លំជ្រៅអាចត្រូវបានបង្កើតឡើងដោយប្រើកុំព្យូទ័រនៅផ្ទះក៏បាន ប៉ុន្តែអ្នកត្រូវការកាតក្រាហ្វិកខ្លាំងមួយ។ វីដេអូនេះបង្ហាញពីការសាកល្បងដំបូងរបស់យើង ដែលវាបង្ហាញពីមូលហេតុសំខាន់មួយក្នុងការប្រើប្រាស់ប្រភពវីដេអូដែលសមស្រប។
Shia LaBeouf
Pilar
ប្រភពវីដេអូគោលដៅ៖ YouTube | MotivaShian | Shia LaBeouf "Just Do It" Motivational Speech
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ចំណុចសង្ស័យ៖
ពណ៌ស្បែកមិនត្រូវគ្នា៖ មានភាពខុសគ្នានៃពណ៌ស្បែករវាងមុខដើម និងមុខដែលដាក់ត្រួតបន្ស៊ី។ មុខហាក់ដូចជាត្រូវបានគ្របដោយស្រទាប់ពណ៌ បង្ហាញគែម ឬចំណុច។
ទឹកមុខមិនត្រូវគ្នា៖ ទឹកមុខនៅលើមុខក្លែងក្លាយមិនត្រូវគ្នានឹងមុខដើម។ ទម្រង់មុខមិនមានលក្ខណៈធម្មជាតិ ហើយដូចជាព្រិលៗ ឬចម្លង។
គែមដែលអាចមើលឃើញ៖ គែមនៃរបាំងអាចមើលឃើញ ទាំងទម្រង់ ឬគែមព្រិលជុំវិញមុខ។
រូបភាពដែលប្រើដើម្បីបង្ហាត់ក្បួនដោះស្រាយនេះ មិនមានទឹកមុខត្រឹមត្រូវដើម្បីបិទបាំងមុខរបស់ Shia នៅក្នុងវីដេអូនោះទេ ហើយក៏មិនមានរូបភាពនៃមុខរបស់គាត់នៅក្នុងប្រវត្តិរូបផងដែរ។ ប្រសិនបើបណ្តាញមិនត្រូវបានបង្រៀនឱ្យធ្វើរឿងទាំងនេះទេ វាមិនអាចបង្កើតម៉ាស់ឌីជីថលត្រឹមត្រូវបានទេ។ សូមកត់សម្គាល់ពីរបៀបដែលមាត់របស់ Shia លេចឡើងពីក្រោមម៉ាស់ដែលបណ្តាលឱ្យមានមាត់ពីរ។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
H64
Project reach
200
/2000 images
106000
/268000 times
64
/128 pixels
31
/63 hours
អ្នកត្រូវការវីដេអូពីរ៖ ប្រភពដើម និងគោលដៅ។ កម្មវិធីនឹងបង្រៀនដោយខ្លួនវាដោយប្រើវីដេអូទាំងពីរ បង្កើតម៉ាស់ពីវីដេអូដើមដែលអាចដាក់ត្រួតលើវីដេអូគោលដៅ ដោយប្រើកម្មវិធីកែសម្រួល។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
750
/2000 images
200000
/268000 times
128
/128 pixels
48
/63 hours
វីដេអូគោលដៅ៖ The Devil Wears Prada
| Andy's Interview
ប្រភពដើម៖
សំណុំទិន្នន័យ៖
ម៉ាស់មុខ៖
តម្រឹម៖
ការក្លែងបន្លំជ្រៅ ៖
កែសម្រួល៖
ជ្រើសរើសវីដេអូគោលដៅដែលអ្នកចង់បញ្ចូលមុខ។ ការជ្រើសរើសវីដេអូដែលមានលំនឹងហើយមានផ្ទៃខាងក្រោយដូចគ្នា នឹងផ្តល់លទ្ធផលល្អប្រសើរ។
កត់ត្រាសំណុំទិន្នន័យសម្រាប់មុខដែលអ្នកចង់ដាក់ (ប្រភព) ដែលមានពន្លឺ និងទឹកមុខត្រូវគ្នាតាមដែលអាចធ្វើបាន។
បិទមុខមនុស្សផ្សេងទៀតដែលមាននៅក្នុងវីដេអូគោលដៅ បើមិនដូច្នេះទេមុខទាំងនោះនឹងត្រូវបានជ្រើសរើសដោយក្បួនដោះស្រាយ និងធ្វើឱ្យមានការភ័ន្តច្រឡំដល់ដំណើរការ។
ក្បួនដោះស្រាយនឹងកាត់តម្រឹមមុខ ដូច្នេះវាអាចប្រើមុខនោះសម្រាប់ដំណើរការ និងរក្សាទុកទីតាំងរបស់មុខដើម្បីដាក់ត្រួតលើម៉ាស់មុខឱ្យបានត្រឹមត្រូវនៅពេលក្រោយ។
ក្បួនដោះស្រាយបង្កើតម៉ាស់មុខពីវីដេអូដើម ដែលបន្ទាប់មកអ្នកត្រូវតម្រឹមលើវីដេអូគោលដៅ។
កម្មវិធីកែវីដេអូនឹងអនុញ្ញាតឱ្យអ្នកលាយបញ្ចូលគ្នាក្នុងម៉ាស់បានល្អជាងមុន និងកែលម្អលទ្ធផលចុងក្រោយ។
នៅក្នុងពិសោធន៍នេះ កម្មវិធីពីរត្រូវបានផ្តល់ចំនួនរូបភាពខុសៗគ្នា។ សម្ភារៈនៃប្រភពកាន់តែច្រើន ធ្វើឱ្យលទ្ធផលកាន់តែប្រសើរឡើង។ វិធីសាស្ត្រនេះមានព័ត៌មានអំពីមុខកាន់តែច្រើន ហើយអាចបង្កើតម៉ាស់មុខបានប្រសើរជាងមុន។
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ពិសោធន៍នេះត្រូវបានធ្វើឡើងជាមួយនឹងវីដេអូប្រភពដូចគ្នាដែលបានស្រង់ចេញក្នុងអត្រាស៊ុមពីរផ្សេងគ្នា – ម៉ូដែលទាំងពីរត្រូវបានបណ្តុះបណ្តាលជាមួយនឹងការរៀបចំស្ទូឌីយោដូចគ្នា។ ចំនួនវដ្តនៃការបណ្តុះបណ្តាលក្នុងមួយរូបភាពគឺស្មើគ្នា ប៉ុន្តែពេលវេលាបណ្តុះបណ្តាលគឺយូរជាង និងប្រើសំណុំទិន្នន័យធំជាង។ អ្នកអាចមើលឃើញយ៉ាងច្បាស់ថា ក្បួនដោះស្រាយដែលបានបណ្តុះបណ្តាលរូបភាពច្រើន អាចបង្កើតលទ្ធផលដែលល្អជាងមុន និងស្របតាមគោលដៅ។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
200
/2000 images
200000
/20000
/268000 times
128
/128 pixels
8
/63 hours
Benedict Cumberbatch
Arthur
វីដេអូគោលដៅដើម៖ Sherlock | The Reichenbach Fall | Rooftop Showdown
យើងបានយករូបភាព Facebook ទាំងអស់ពីសមាជិកម្នាក់ក្នុងក្រុមរបស់យើង ហើយបានបង្កើតរូបភាពក្លែងក្លាយ។ រូបភាពដើមស្ទើរតែទាំងអស់ឃើញនាងញញឹម ដូច្នេះក្បួនដោះស្រាយមិនអាចបង្កើតម៉ាស់មុខដែលមិនញញឹមបានទេ។
Natalie Portman
Pilar
វីដេអូគោលដៅដើម៖ Star Wars: Episode I – The Phantom Menace | Padmé meets Anakin
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ចំណុចសង្ស័យ៖
មុខមិនច្បាស់៖: ម៉ាស់មុខមានសភាពព្រិល។ មានភាពខុសប្លែកគ្នានៅក្នុងភាពច្បាស់ឬគុណភាពបង្ហាញ រវាងម៉ាស់មុខនិងផ្នែកផ្សេងទៀតនៃវីដេអូ។
ទឹកមុខមិនត្រូវគ្នា៖ ទឹកមុខនៅលើមុខក្លែងក្លាយមិនត្រូវគ្នានឹងមុខដើម។ ទម្រង់មុខមិនមានលក្ខណៈធម្មជាតិ ហើយដូចជាព្រិលៗ ឬចម្លង។
ស៊ុម ៖ រូបចំហៀងនៃមុខដូចជាខុស។ ម៉ាស់មុខបានខូច មិនសូវលម្អិត ឬតម្រឹមមិនត្រឹមត្រូវ។
វីដេអូមួយមានភាពខុសប្លែកមុខច្រើនជាងរូបភាពដែលយើងយកចេញពី Facebook។ រូបថតសមាជិកក្រុមរបស់យើងនៅលើប្រព័ន្ធផ្សព្វផ្សាយសង្គមត្រូវបានជ្រើសរើសដោយខ្លួនឯង ដូច្នេះវាបាត់ប្រភេទនៃរូបភាពដែលត្រូវការដើម្បីបង្កើតទឹកមុខជាក់ស្តែងសម្រាប់ការនិយាយ។ ទោះបីជាបច្ចេកវិទ្យាដែលទំនើបជាងមុន អាចត្រាប់តាមទឹកមុខក៏ដោយ បើគ្មានប្រភពចម្រុះគ្នាទេ វាមិនអាចបង្កើតអ្វីមួយដែលគួរឱ្យជឿជាក់បានទេ។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
165
/2000 images
215000
/268000 times
128
/128 pixels
44
/63 hours
ទោះបីជាមានប្រភពល្អក៏ដោយ វាអាចពិបាកក្នុងការបង្កើតរូបក្លែងបន្លំជ្រៅមួយ។ រូប Indiana Jones មានប្លង់ដ៏ស្មុគស្មាញមួយ។ បើប្រៀបធៀបទៅនឹងវីដេអូដែលស្អាតជាងមុន ដែលយើងធ្លាប់ប្រើពីមុន ក្បួនដោះស្រាយពិបាកក្នុងការតាមឱ្យទាន់យើង។
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ចំណុចសង្ស័យ៖
មុខមិនច្បាស់៖: ម៉ាស់មុខមានសភាពព្រិល។ មានភាពខុសប្លែកគ្នានៅក្នុងភាពច្បាស់ឬគុណភាពបង្ហាញ រវាងម៉ាស់មុខនិងផ្នែកផ្សេងទៀតនៃវីដេអូ។
បម្លាស់ប្ដូរពន្លឺ ៖ មានការលោតភ្លឹបភ្លែតៗរវាងមុខដើម និងមុខក្លែងក្លាយ។ ក្បួនដោះស្រាយមិនអាចសម្គាល់មុខ ហើយការបង្កើតម៉ាស់បានគាំង។
ព័ត៌មានបច្ចេកទេសខុសគ្នា៖ ការក្លែងបន្លំជ្រៅមានព័ត៌មានបច្ចេកទេសខុសពីផ្នែកផ្សេងទៀតនៃវីដេអូ។ វីដេអូដើម និងវីដេអូគោលដៅមានប្រវែងខុសគ្នា។
ការក្លែងបន្លំជ្រៅ ត្រូវបាននាំចេញដោយមានគុណភាពបង្ហាញ 64 px។ គុណភាពបង្ហាញទាបមានន័យថាវាចំណាយពេលតិចជាងមុនដើម្បីបណ្តុះបណ្តាលក្បួនដោះស្រាយ ពីព្រោះម៉ូដែលគ្រាន់តែរៀនពីរបៀបបង្កើតរូបភាពដែលមានគុណភាពបង្ហាញទាបប៉ុណ្ណោះ។ ភស្តុតាងនៃការថតរូបជិតៗ គឺគុណភាពបង្ហាញមកទាប។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
1400
/2000 images
100000
/268000 times
64
/128 pixels
8
/63 hours
Harrison Ford
Andrej
វីដេអូគោលដៅដើម៖ Indiana Jones and the Temple of Doom | Rope Bridge Fight
វីដេអូក្លែងក្លាយនេះត្រូវបានបង្កើតឡើងពីការជជែកពិភាក្សាដែល Bill Hader ក្លែងខ្លួនជា Arnold Schwarzenegger។ ដោយប្រើប្រភពសមរម្យរបស់ Arnold Schwarzenegger លទ្ធផលដែលចេញមកពិតជាគួរឱ្យជឿជាក់។
Bill Hader
Arnold Schwarzenegger
វីដេអូគោលដៅដើម៖ Bill Hader Presents: Schwarzenegger Baby
ប្រភពវីដេអូក្លែងក្លាយ៖ YouTube | Ctrl Shift Face | Bill Hader impersonates Arnold Schwarzenegger [DeepFake]
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ចំណុចសង្ស័យ៖
ការបិទមុខ៖ នៅពេលដែលវត្ថុឆ្លងកាត់ពីមុខ ម៉ាស់មុខនឹងខូចទ្រង់ទ្រាយ ឬបាំងវត្ថុនោះ។
ការលាយមុខ ព័ណ៌ស្បែក និងគុណភាពពិជាល្អណាស់។ ការថតពីចម្ងាយធ្វើឱ្យយើងពិបាកក្នុងការមើលឃើញព្រិលៗ។ ការកាត់តត្រូវបានធ្វើដោយអ្នកជំនាញ។ ចំណុចសង្ស័យតែមួយគត់គឺនៅពេលដែល Bill Hader ផ្លាស់ទីម្រាមដៃរបស់គាត់នៅចំពីមុខ មុខរបស់គាត់ហើយវាបាត់នៅពីក្រោយម៉ាស់មុខ។ ភាពខុសគ្នានៃភាពច្បាស់ និងមុំនៃម្រាមដៃនេះ បង្ហាញថា អ្នកកាត់តព្យាយាមលាក់ការកែប្រែនៅពេលកាត់ត។
សម្រាប់ពិសោធន៍នេះ ម៉ូដែលមួយត្រូវបានបណ្តុះបណ្តាលរយៈពេល 4 ម៉ោង និងមួយទៀតរយៈពេល 48 ម៉ោង។ លទ្ធផលនៃគំរូរយៈពេល 48 ម៉ោងបានបង្ហាញពីភាពប្រសើរឡើងនៃផ្ទៃមុខ និងមុខ 3D បន្ថែមទៀត។
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ពេលវេលាបណ្តុះបណ្តាលគឺទាក់ទងទៅនឹងចំនួនដងដែលក្បួនដោះស្រាយដំណើរការលើរូបភាព។ ដំណើរការនេះពាក់ព័ន្ធនឹងការបង្កើតមុខ (ឬម៉ាស់ឌីជីថល) ដោយប្រៀបធៀបវាជាមួយនឹងប្រភពរូបភាព ហើយបន្ទាប់មកធ្វើការកែតម្រូវដើម្បីកែលម្អភាពស្រដៀងគ្នានៃម៉ាស់ទៅនឹងប្រភពដើម។ គំរូឆ្លងកាត់វដ្តនេះតែម្តងប៉ុណ្ណោះសម្រាប់រូបភាពប្រភពទាំងអស់ ហើយបន្ទាប់មកចាប់ផ្តើមម្តងទៀត។ ពេលវេលាដែលវាត្រូវការគឺអាស្រ័យលើថាមពលរបស់កុំព្យូទ័រដែលបានប្រើ។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
400
/400
/2000 images
20000
/268000 times
128
/128 pixels
4
/48
/63 hours
Constance Wu
Yueling
សម្រាប់ការពិសោធនេះ យើងបានបង្កើតទាំងប្រភព និងវីដេអូគោលដៅដោយខ្លួនឯង។ វិធីសាស្រ្តនៃក្បួនដោះស្រាយគឺអាចមើលឃើញយ៉ាងច្បាស់។ ទម្រង់ H128 បង្កើតម៉ាស់រាងការេ ខណៈពេលដែលទម្រង់ SAEHD ផ្គូរផ្គងមុខកាន់តែប្រសើរ។
Arthur
Andrej
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ទម្រង់ H128 គឺជាគំរូស្រាលជាងមុននៃទម្រង់ទាំងពីរ។ វាសម្រេចបានលទ្ធផលគុណភាពលឿនជាងមុន។ ម៉ាស់មុខរបស់ទម្រង់ SAEHD កាន់តែច្បាស់គឺប្រសើរជាងក្នុងការទាក់ទងនឹងចលនាដៃ និងការបញ្ចូលគ្នាជាមួយនឹងពន្លឺ។ H128 ហាក់ដូចជាត្រូវបានហ្វឹកហាត់បានប្រសើរជាងមុនដើម្បីបង្កើតមុខ៖ ម៉ាស់មុខមានភាពច្បាស់ ហើយនឹងនរជាងមុន និងដំណើរការកាន់តែប្រសើរជាមួយនឹងការផ្លាស់ប្តូរចលនា និងជ្រុងនៃការមើលឃើញ។ ទោះជាយ៉ាងណាក៏ដោយអ្នកជំនាញនិយាយថាជាមួយនឹងពេលវេលាបណ្តុះបណ្តាលកាន់តែច្រើន ទម្រង់ SAEHD នឹងដំណើរការលើសពីទម្រង់ H128 ។
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
H128
Project reach
500
/500
/2000 images
150000
/150000
/268000 times
128
/128 pixels
24
/40
/63 hours
ប្រុងប្រយ័ត្ន៖ របស់ក្លែងក្លាយអាចមានគុណភាពខ្ពស់និងពិបាកសម្គាល់។ ទោះបីជាយើងបានផ្តោតលើការផ្លាស់ប្តូរមុខក៏ដោយ ការក្លែងបន្លំជ្រៅក៏អាចត្រូវបានប្រើសម្រាប់ការកែទម្រង់មុខឡើងវិញដែរ ដែលធ្វើឱ្យវាហាក់ដូចជាមនុស្សម្នាក់និយាយអ្វីមួយ។
ព័ត៌មានលម្អិតបច្ចេកទេស៖
ការកែទម្រង់មុខត្រូវការថាមពលកុំព្យូទ័រច្រើន ប៉ុន្តែវារឹតតែពិបាកសម្គាល់។ បញ្ហាប្រឈមជាច្រើនដែលបង្កឡើងដោយប្រភពរបស់វីដេអូ មិនត្រូវគ្នាជាមួយការកែទម្រង់មុខឡើងវិញនោះទេ ប៉ុន្តែក្បួនដោះស្រាយដំណើរការតាមរបៀបស្រដៀងគ្នា។ ផ្នែកដែលបានបង្កើតឡើងវិញនៃមុខនឹងមានភាពព្រិលបន្តិច និងមិនសូវលម្អិត។
ដូចគ្នានេះផងដែរ យកចិត្តទុកដាក់លើសម្លេងនិងរកមើលកំហុសឬបញ្ហានៃការធ្វើត្រាប់តាមបបូរមាត់។ ដោយប្រើចំណេះដឹងដែលអ្នកបានរៀននៅលើគេហទំព័រនេះ សួរសំណួរទៅលើវីដេអូមួយដែលប្រហែលជាវីដេអូរគោលដៅ ហើយថាតើវាអាចទៅរួចទេដែលវីដេអូរនោះជាការក្លែងបន្លំជ្រៅ។ ប្រសិនបើមានការសង្ស័យ សូមពិនិត្យមើលប្រភពនៃវីដេអូ។