Restarting the experience

Deep

fake

Lab

ស្រាយអាថ៌កំបាំងជុំវិញការក្លែងបន្លំជ្រៅ

ឈ្វេងយល់ពីដំណើរការក្លែងបន្លំជ្រៅ ​និងតម្រុយសោទស្សន៍ដែលអ្នកអាចប្រើដើម្បីកំណត់អត្តសញ្ញាណពួកវា តាមរយៈរឿងរ៉ាវនៃការស្រាវជ្រាវ និងឧទាហរណ៍ពីទូទាំងបណ្តាញអ៊ីនធឺណិត។

01. ទារក Tesla

សូមក្រឡេកមើលឧទាហរណ៍ដ៏ពេញនិយមមួយពីអ៊ីននធឺណិត។

នៅក្នុងវីដេអូនេះ មុខរបស់ទារកត្រូវបានយកទៅដាក់លើមុខលោក Elon Musk ។ ប្រភេទនៃការប្តូរមុខនេះគឺជាការប្រើញឹកញាប់បំផុតនៃការក្លែងបន្លំជ្រៅ (deepfakes)។ មើលឱ្យជិត៖ ជ្រុងមុខក៏មិនត្រូវគ្នា ហើយពណ៌ស្បែកក៏ខុសគ្នា។

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ចំណុចសង្ស័យ៖

ការរក្លែងបន្លំជ្រៅត្រូវបានបង្កើតឡើងដោយកម្មវិធីកុំព្យូទ័រដែលអាចបង្រៀនខ្លួនឯងពីរបៀបបង្កើតមុខឡើងវិញដោយការវិភាគរូបភាពជាច្រើនរបស់មនុស្ស។ បន្ទាប់មក កម្មវិធីនេះនឹងត្រួតបន្ស៊ីគ្នាលើមុខដែលវាបានបង្កើតឡើងវិញនៅលើវីដេអូដែលមានស្រាប់ - ដូចជាម៉ាស់ឌីជីថល។ អ្នកអាចឃើញដាននៃម៉ាស់បែបនេះនៅក្នុងវីដេអូនេះ៖

Target Video

Deepfaked Video

វីដេអូគោលដៅការក្លែងបន្លំជ្រៅ៖ YouTube | AndrewSchrock | Cutest Baby Montage Ever.

ប្រភពវីដេអូរក្លែងបន្លំជ្រៅ៖ YouTube | TheFakening | Baby Elon Musk Montage Deepfake

02. សាកល្បងខ្លួនឯង

អ្នកក៏អាចសាកល្បងវានៅផ្ទះបានដែរ។ យើងនឹងប្រាប់អ្នកពីវិធីធ្វើវា។

វីដេអូក្លែងបន្លំជ្រៅអាច​ត្រូវ​បាន​បង្កើត​ឡើងដោយប្រើកុំព្យូទ័រ​នៅ​ផ្ទះក៏បាន ប៉ុន្តែ​អ្នក​ត្រូវ​ការ​កាត​ក្រាហ្វិកខ្លាំងមួយ។ វីដេអូនេះបង្ហាញពីការសាកល្បងដំបូងរបស់យើង ដែលវាបង្ហាញពីមូលហេតុសំខាន់មួយក្នុងការប្រើប្រាស់ប្រភពវីដេអូដែលសមស្រប។

Shia LaBeouf

Pilar

ប្រភពវីដេអូគោលដៅ៖ YouTube | MotivaShian | Shia LaBeouf "Just Do It" Motivational Speech

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ចំណុចសង្ស័យ៖

រូបភាពដែលប្រើដើម្បីបង្ហាត់ក្បួនដោះស្រាយនេះ មិនមានទឹកមុខត្រឹមត្រូវដើម្បីបិទបាំងមុខរបស់ Shia នៅក្នុងវីដេអូនោះទេ ហើយក៏មិនមានរូបភាពនៃមុខរបស់គាត់នៅក្នុងប្រវត្តិរូបផងដែរ។ ប្រសិនបើបណ្តាញមិនត្រូវបានបង្រៀនឱ្យធ្វើរឿងទាំងនេះទេ វាមិនអាចបង្កើតម៉ាស់ឌីជីថលត្រឹមត្រូវបានទេ។ សូមកត់សម្គាល់ពីរបៀបដែលមាត់របស់ Shia លេចឡើងពីក្រោមម៉ាស់ដែលបណ្តាលឱ្យមានមាត់ពីរ។

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

H64

Project reach

200

/2000 images

106000

/268000 times

64

/128 pixels

31

/63 hours

03. ដំណើរការ

ដូច្នេះតើអ្នកបង្កើតសោទស្សន៍ក្លែងក្លាយយ៉ាងដូចម្តេច?

អ្នកត្រូវការវីដេអូពីរ៖ ប្រភពដើម និងគោលដៅ។ កម្មវិធីនឹងបង្រៀនដោយខ្លួនវាដោយប្រើវីដេអូទាំងពីរ បង្កើតម៉ាស់ពីវីដេអូដើមដែលអាចដាក់ត្រួតលើវីដេអូគោលដៅ ដោយប្រើកម្មវិធីកែសម្រួល។ 

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

SAEHD

Project reach

750

/2000 images

200000

/268000 times

128

/128 pixels

48

/63 hours




វីដេអូគោលដៅ៖ The Devil Wears Prada | Andy's Interview

ប្រភពដើម៖

សំណុំទិន្នន័យ៖  

ម៉ាស់មុខ៖

តម្រឹម៖

ការក្លែងបន្លំជ្រៅ ៖

កែសម្រួល៖

ជ្រើសរើសវីដេអូគោលដៅដែលអ្នកចង់បញ្ចូលមុខ។ ការជ្រើសរើសវីដេអូដែលមានលំនឹងហើយមានផ្ទៃខាងក្រោយដូចគ្នា នឹងផ្តល់លទ្ធផលល្អប្រសើរ។

04. បណ្តុះបណ្តាលទិន្នន័យ

តើមានអ្វីកើតឡើងប្រសិនបើយើងផ្តល់មាតិកាបន្ថែមទៀតឱ្យកម្មវិធី? តើវានឹងប្រសើរឡើងទេ?

នៅក្នុងពិសោធន៍នេះ កម្មវិធីពីរត្រូវបានផ្តល់ចំនួនរូបភាពខុសៗគ្នា។ សម្ភារៈនៃប្រភពកាន់តែច្រើន ធ្វើឱ្យលទ្ធផលកាន់តែប្រសើរឡើង។ វិធីសាស្ត្រនេះមានព័ត៌មានអំពីមុខកាន់តែច្រើន ហើយអាចបង្កើតម៉ាស់មុខបានប្រសើរជាងមុន។

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ពិសោធន៍នេះត្រូវបានធ្វើឡើងជាមួយនឹងវីដេអូប្រភពដូចគ្នាដែលបានស្រង់ចេញក្នុងអត្រាស៊ុមពីរផ្សេងគ្នា – ម៉ូដែលទាំងពីរត្រូវបានបណ្តុះបណ្តាលជាមួយនឹងការរៀបចំស្ទូឌីយោដូចគ្នា។ ចំនួនវដ្តនៃការបណ្តុះបណ្តាលក្នុងមួយរូបភាពគឺស្មើគ្នា ប៉ុន្តែពេលវេលាបណ្តុះបណ្តាលគឺយូរជាង និងប្រើសំណុំទិន្នន័យធំជាង។ អ្នកអាចមើលឃើញយ៉ាងច្បាស់ថា ក្បួនដោះស្រាយដែលបានបណ្តុះបណ្តាលរូបភាពច្រើន អាចបង្កើតលទ្ធផលដែលល្អជាងមុន និងស្របតាមគោលដៅ។

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

SAEHD

Project reach

200

/2000 images

200000

/20000

/268000 times

128

/128 pixels

8

/63 hours

Benedict Cumberbatch

Arthur

វីដេអូគោលដៅដើម៖ Sherlock | The Reichenbach Fall | Rooftop Showdown

05. ការក្លែងបន្លំតាមបណ្ដាញសង្គម

តើអ្នកងាយរងគ្រោះប៉ុណ្ណា? តើយើងអាចលួចមាតិកាពីប្រព័ន្ធផ្សព្វផ្សាយសង្គមរបស់អ្នក ហើយបង្កើតការក្លែងបន្លំជ្រៅបានទេ?

យើង​បាន​យក​រូបភាព Facebook ទាំងអស់​ពី​សមាជិក​ម្នាក់​ក្នុង​ក្រុម​របស់​យើង ហើយ​បាន​បង្កើត​រូបភាព​ក្លែងក្លាយ។ រូបភាពដើមស្ទើរតែទាំងអស់ឃើញនាងញញឹម ដូច្នេះក្បួនដោះស្រាយមិនអាចបង្កើតម៉ាស់មុខដែលមិនញញឹមបានទេ។ 

Natalie Portman

Pilar

វីដេអូគោលដៅដើម៖ Star Wars: Episode I – The Phantom Menace | Padmé meets Anakin

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ចំណុចសង្ស័យ៖

វីដេអូ​មួយ​មាន​ភាព​ខុស​ប្លែក​មុខ​ច្រើន​ជាង​រូបភាព​ដែល​យើង​យកចេញ​ពី Facebook។ រូបថតសមាជិកក្រុមរបស់យើងនៅលើប្រព័ន្ធផ្សព្វផ្សាយសង្គមត្រូវបានជ្រើសរើសដោយខ្លួនឯង ដូច្នេះវាបាត់ប្រភេទនៃរូបភាពដែលត្រូវការដើម្បីបង្កើតទឹកមុខជាក់ស្តែងសម្រាប់ការនិយាយ។ ទោះបីជាបច្ចេកវិទ្យាដែលទំនើបជាងមុន អាចត្រាប់តាមទឹកមុខក៏ដោយ បើគ្មានប្រភពចម្រុះគ្នាទេ វាមិនអាចបង្កើតអ្វីមួយដែលគួរឱ្យជឿជាក់បានទេ។

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

SAEHD

Project reach

165

/2000 images

215000

/268000 times

128

/128 pixels

44

/63 hours

06. ជម្រើសគោលដៅ

យើងបានឃើញពីរបៀបដែលប្រភពមានសារៈសំខាន់ក្នុងការបណ្តុះបណ្តាលក្បួនដោះស្រាយ។ ចុះវីដេអូគោលដៅ?

ទោះបីជាមានប្រភពល្អក៏ដោយ វាអាចពិបាកក្នុងការបង្កើតរូបក្លែងបន្លំជ្រៅមួយ។ រូប Indiana Jones មានប្លង់ដ៏ស្មុគស្មាញ​មួយ។ បើប្រៀបធៀបទៅនឹងវីដេអូដែលស្អាតជាងមុន ដែលយើងធ្លាប់ប្រើពីមុន ក្បួនដោះស្រាយពិបាកក្នុងការតាមឱ្យទាន់យើង។

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ចំណុចសង្ស័យ៖

ការក្លែងបន្លំជ្រៅ ត្រូវបាននាំចេញដោយមានគុណភាពបង្ហាញ 64 px។ គុណភាពបង្ហាញទាបមានន័យថាវាចំណាយពេលតិចជាងមុនដើម្បីបណ្តុះបណ្តាលក្បួនដោះស្រាយ ពីព្រោះម៉ូដែលគ្រាន់តែរៀនពីរបៀបបង្កើតរូបភាពដែលមានគុណភាពបង្ហាញទាបប៉ុណ្ណោះ។ ភស្តុតាងនៃការថតរូបជិតៗ គឺគុណភាពបង្ហាញមកទាប។

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

SAEHD

Project reach

1400

/2000 images

100000

/268000 times

64

/128 pixels

8

/63 hours

Harrison Ford

Andrej

វីដេអូគោលដៅដើម៖ Indiana Jones and the Temple of Doom | Rope Bridge Fight

07. កុំព្រិចភ្នែក

ពេលខ្លះវីដេអូទាំងពីររលាយចូលគ្នា។ ក្នុងវីដេអូនេះ គោលដៅថែមទាំងធ្វើត្រាប់តាមមុខថ្មីរបស់វាទៀតផង។

វីដេអូ​ក្លែងក្លាយ​នេះ​ត្រូវ​បាន​បង្កើត​ឡើង​ពី​ការជជែក​ពិភាក្សា​ដែល Bill Hader ក្លែង​ខ្លួន​ជា Arnold Schwarzenegger។ ដោយប្រើប្រភពសមរម្យរបស់ Arnold Schwarzenegger លទ្ធផលដែលចេញមកពិតជាគួរឱ្យជឿជាក់។

Bill Hader

Arnold Schwarzenegger

វីដេអូគោលដៅដើម៖ Bill Hader Presents: Schwarzenegger Baby

ប្រភពវីដេអូក្លែងក្លាយ៖ YouTube | Ctrl Shift Face | Bill Hader impersonates Arnold Schwarzenegger [DeepFake]

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ចំណុចសង្ស័យ៖

ការលាយមុខ ព័ណ៌ស្បែក និងគុណភាពពិជាល្អណាស់។ ការថតពីចម្ងាយធ្វើឱ្យយើងពិបាកក្នុងការមើលឃើញព្រិលៗ។ ការកាត់ត​ត្រូវ​បាន​ធ្វើ​ដោយ​អ្នកជំនាញ។ ចំណុចសង្ស័យតែមួយគត់គឺនៅពេលដែល Bill Hader ផ្លាស់ទីម្រាមដៃរបស់គាត់នៅចំពីមុខ មុខរបស់គាត់ហើយវាបាត់នៅពីក្រោយម៉ាស់មុខ។ ភាពខុសគ្នានៃភាពច្បាស់ និងមុំនៃម្រាមដៃនេះ បង្ហាញថា អ្នកកាត់តព្យាយាមលាក់ការកែប្រែនៅពេលកាត់ត។

08. ពេលវេលាមានសារៈសំខាន់

តើមានអ្វីកើតឡើងប្រសិនបើយើងអនុញ្ញាតឱ្យក្បួនដោះស្រាយអនុវត្តបន្ថែមទៀតលើប្រភពដើមនៃខ្លឹមសារ។ តើលទ្ធផលនឹងប្រសើរឡើងទេ?

សម្រាប់ពិសោធន៍នេះ ម៉ូដែលមួយត្រូវបានបណ្តុះបណ្តាលរយៈពេល 4 ម៉ោង និងមួយទៀតរយៈពេល 48​ ម៉ោង។ លទ្ធផលនៃគំរូរយៈពេល 48 ម៉ោងបានបង្ហាញពីភាពប្រសើរឡើងនៃផ្ទៃមុខ និងមុខ​ 3D បន្ថែមទៀត។

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ពេលវេលាបណ្តុះបណ្តាលគឺទាក់ទងទៅនឹងចំនួនដងដែលក្បួនដោះស្រាយដំណើរការលើរូបភាព។ ដំណើរការនេះពាក់ព័ន្ធនឹងការបង្កើតមុខ (ឬម៉ាស់ឌីជីថល) ដោយប្រៀបធៀបវាជាមួយនឹងប្រភពរូបភាព ហើយបន្ទាប់មកធ្វើការកែតម្រូវដើម្បីកែលម្អភាពស្រដៀងគ្នានៃម៉ាស់ទៅនឹងប្រភពដើម។ គំរូឆ្លងកាត់វដ្តនេះតែម្តងប៉ុណ្ណោះសម្រាប់រូបភាពប្រភពទាំងអស់ ហើយបន្ទាប់មកចាប់ផ្តើមម្តងទៀត។ ពេលវេលាដែលវាត្រូវការគឺអាស្រ័យលើថាមពលរបស់កុំព្យូទ័រដែលបានប្រើ។

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

SAEHD

Project reach

400

/400

/2000 images

20000

/268000 times

128

/128 pixels

4

/48

/63 hours

Constance Wu

Yueling

09. ក្បួនដោះស្រាយ

ការពិសោធចុងក្រោយ។ តើ​ក្បួន​ដោះស្រាយ​ខុស​គ្នា​ឆ្លើយ​តប​នឹង​លក្ខខណ្ឌជាក់លាក់​មួយ​ចំនួន​ដោយ​របៀប​ណា?

សម្រាប់ការពិសោធនេះ យើងបានបង្កើតទាំងប្រភព និងវីដេអូគោលដៅដោយខ្លួនឯង។ វិធីសាស្រ្តនៃក្បួនដោះស្រាយគឺអាចមើលឃើញយ៉ាងច្បាស់។ ទម្រង់ H128 បង្កើតម៉ាស់រាងការេ ខណៈពេលដែលទម្រង់ SAEHD ផ្គូរផ្គងមុខកាន់តែប្រសើរ។  

Arthur

Andrej

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ទម្រង់ H128 គឺជាគំរូស្រាលជាងមុននៃទម្រង់ទាំងពីរ។ វាសម្រេចបានលទ្ធផលគុណភាពលឿនជាងមុន។ ម៉ាស់មុខរបស់ទម្រង់ SAEHD កាន់តែច្បាស់គឺប្រសើរជាងក្នុងការទាក់ទងនឹងចលនាដៃ និងការបញ្ចូលគ្នាជាមួយនឹងពន្លឺ។ H128 ហាក់ដូចជាត្រូវបានហ្វឹកហាត់បានប្រសើរជាងមុនដើម្បីបង្កើតមុខ៖ ម៉ាស់មុខមានភាពច្បាស់ ហើយនឹងនរជាងមុន និងដំណើរការកាន់តែប្រសើរជាមួយនឹងការផ្លាស់ប្តូរចលនា និងជ្រុងនៃការមើលឃើញ។ ទោះជាយ៉ាងណាក៏ដោយអ្នកជំនាញនិយាយថាជាមួយនឹងពេលវេលាបណ្តុះបណ្តាលកាន់តែច្រើន ទម្រង់ SAEHD នឹងដំណើរការលើសពីទម្រង់ H128 ។

Algorithm

Dataset size

Iteration amount

Output resolution

Training time

SAEHD

H128

Project reach

500

/500

/2000 images

150000

/150000

/268000 times

128

/128 pixels

24

/40

/63 hours

10. ប្រុងប្រយ័ត្ន

តោះ ទៅមើលថាមានអ្វីកើតឡើងជាមួយវីដេអូក្លែងក្លាយជ្រៅ។

ប្រុងប្រយ័ត្ន៖ របស់ក្លែងក្លាយអាចមានគុណភាពខ្ពស់និងពិបាកសម្គាល់។ ទោះបីជាយើងបានផ្តោតលើការផ្លាស់ប្តូរមុខក៏ដោយ ការក្លែងបន្លំជ្រៅក៏អាចត្រូវបានប្រើសម្រាប់ការកែទម្រង់មុខឡើងវិញដែរ ដែលធ្វើឱ្យវាហាក់ដូចជាមនុស្សម្នាក់និយាយអ្វីមួយ។

ព័ត៌មានលម្អិតបច្ចេកទេស៖

ការកែទម្រង់មុខត្រូវការថាមពលកុំព្យូទ័រច្រើន ប៉ុន្តែវារឹតតែពិបាកសម្គាល់។ បញ្ហាប្រឈមជាច្រើនដែលបង្កឡើងដោយប្រភពរបស់វីដេអូ មិនត្រូវគ្នាជាមួយការកែទម្រង់មុខឡើងវិញនោះទេ ប៉ុន្តែក្បួនដោះស្រាយដំណើរការតាមរបៀបស្រដៀងគ្នា។ ផ្នែកដែលបានបង្កើតឡើងវិញនៃមុខនឹងមានភាពព្រិលបន្តិច និងមិនសូវលម្អិត។

ដូចគ្នានេះផងដែរ យកចិត្តទុកដាក់លើសម្លេងនិងរកមើលកំហុសឬបញ្ហានៃការធ្វើត្រាប់តាមបបូរមាត់។ ដោយប្រើចំណេះដឹងដែលអ្នកបានរៀននៅលើគេហទំព័រនេះ សួរសំណួរទៅលើវីដេអូមួយដែលប្រហែលជាវីដេអូរគោលដៅ ហើយថាតើវាអាចទៅរួចទេដែលវីដេអូរនោះជាការក្លែងបន្លំជ្រៅ។ ប្រសិនបើមានការសង្ស័យ សូមពិនិត្យមើលប្រភពនៃវីដេអូ។

ប្រភពវីដេអូ៖ YouTube | VFXChris Ume | Fake Freeman mouth manipulation.

នេះជាការសង្ខេបដ៏ងាយស្រួលនៃជំនាញដែលអ្នកទទួលបាននៅលើគេហទំព័រនេះ ដូច្នេះអ្នកអាចពិនិត្យមើលវីដេអូដោយខ្លួនឯងបាន

All the original deepfakes in this project were created with the open source software DeepFaceLab v10.1 by Iperov, under the GNU General Public License v3.0