Spoiler Alert: ปัญญาประดิษฐ์สามารถทำนายได้ว่าฉากจะเล่นได้อย่างไร

{h1}

ระบบปัญญาประดิษฐ์ใหม่สามารถถ่ายภาพนิ่งและสร้างวิดีโอสั้น ๆ ที่จำลองสิ่งที่เกิดขึ้นถัดไปคล้ายกับที่มนุษย์สามารถจินตนาการได้ว่าฉากจะมีวิวัฒนาการอย่างไรตามการศึกษาใหม่

ระบบปัญญาประดิษฐ์ใหม่สามารถถ่ายภาพนิ่งและสร้างวิดีโอสั้น ๆ ที่จำลองสิ่งที่เกิดขึ้นถัดไปคล้ายกับที่มนุษย์สามารถจินตนาการได้ว่าฉากจะมีวิวัฒนาการอย่างไรตามการศึกษาใหม่

มนุษย์เข้าใจอย่างถ่องแท้ว่าโลกทำงานอย่างไรซึ่งทำให้ผู้คนง่ายขึ้นเมื่อเทียบกับเครื่องจักรเพื่อจินตนาการว่าฉากจะเป็นอย่างไร แต่วัตถุในภาพนิ่งสามารถเคลื่อนที่และโต้ตอบในหลากหลายวิธีทำให้มันยากมากสำหรับเครื่องจักรที่จะบรรลุผลสำเร็จนี้นักวิจัยกล่าว แต่ระบบการเรียนรู้ลึกที่เรียกว่าใหม่สามารถหลอกมนุษย์ได้ 20 เปอร์เซ็นต์ของเวลาเมื่อเปรียบเทียบกับวิดีโอจริง

นักวิจัยที่สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) จับคู่โครงข่ายประสาทเทียมสองเครือข่ายโดยพยายามพยายามแยกแยะวิดีโอจริงจากวิดีโอที่สร้างจากเครื่องและอีกอันพยายามสร้างวิดีโอที่สมจริงพอที่จะหลอกลวงระบบแรก [เครื่องจักรที่ชาญฉลาด: 7 หุ่นยนต์อนาคต]

การตั้งค่าประเภทนี้เรียกว่า "เครือข่ายผู้ให้กำเนิด (advantarial network)" (GAN) และการแข่งขันระหว่างระบบทำให้วิดีโอมีความสมจริงมากขึ้น เมื่อนักวิจัยถามพนักงานเกี่ยวกับแพลตฟอร์มการระดมทุนทางกล Turk Turk ของ Amazon เพื่อเลือกวิดีโอที่เป็นของจริงผู้ใช้เลือกวิดีโอที่สร้างด้วยเครื่องจักรมากกว่าของแท้ 20% ของเวลานักวิจัยกล่าว

ช่วงแรก ๆ

ถึงกระนั้นผู้กำกับภาพยนตร์รุ่นใหม่อาจไม่จำเป็นต้องกังวลเกี่ยวกับเครื่องจักรที่เข้ามาทำหน้าที่มากเกินไป - วิดีโอมีความยาวเพียง 1 ถึง 1.5 วินาทีและสร้างด้วยความละเอียด 64 x 64 พิกเซล แต่นักวิจัยกล่าวว่าวิธีการในที่สุดจะช่วยให้หุ่นยนต์และรถยนต์ที่ขับเคลื่อนด้วยตนเองนำทางสภาพแวดล้อมแบบไดนามิกและโต้ตอบกับมนุษย์หรือให้ Facebook ติดแท็กวิดีโอโดยอัตโนมัติพร้อมป้ายกำกับที่อธิบายสิ่งที่เกิดขึ้น

“ อัลกอรึทึมของเราสามารถสร้างวิดีโอที่สมจริงอย่างมีเหตุผลในสิ่งที่คิดว่าอนาคตจะเป็นอย่างไรซึ่งแสดงให้เห็นว่ามันเข้าใจในบางระดับว่าเกิดอะไรขึ้นในปัจจุบัน” Carl Vondrick ปริญญาเอกกล่าว นักศึกษาในห้องปฏิบัติการวิทยาศาสตร์คอมพิวเตอร์และปัญญาประดิษฐ์ของ MIT ซึ่งเป็นผู้นำการวิจัย "งานของเราคือการพัฒนาที่ส่งเสริมในการแนะนำให้นักวิทยาศาสตร์คอมพิวเตอร์สามารถปลูกฝังเครื่องที่มีความเข้าใจสถานการณ์ขั้นสูงมากขึ้น"

ระบบนี้ยังสามารถเรียนรู้ที่ไม่มีผู้ดูแลได้เช่นกัน ซึ่งหมายความว่าวิดีโอสองล้านวิดีโอซึ่งเทียบเท่ากับวิดีโอมูลค่าประมาณหนึ่งปีว่าระบบได้รับการฝึกฝนไม่จำเป็นต้องติดป้ายกำกับโดยมนุษย์ซึ่งช่วยลดเวลาในการพัฒนาและปรับให้เข้ากับข้อมูลใหม่ได้อย่างมาก

ในการศึกษาที่จะนำเสนอในการประชุมระบบประมวลผลข้อมูลประสาท (NIPS) ซึ่งจะจัดขึ้นระหว่าง 5 ถึง 10 ธันวาคมในบาร์เซโลนา, สเปน, นักวิจัยอธิบายว่าพวกเขาฝึกอบรมระบบโดยใช้วิดีโอของชายหาดสถานีรถไฟ โรงพยาบาลและสนามกอล์ฟ

“ ในต้นแบบแรก ๆ ความท้าทายหนึ่งที่เราค้นพบก็คือโมเดลจะทำนายว่าพื้นหลังจะบิดเบี้ยวและบิดเบี้ยว” Vondrick กล่าวกับ WordsSideKick.com เพื่อเอาชนะสิ่งนี้พวกเขาปรับเปลี่ยนการออกแบบเพื่อให้ระบบเรียนรู้แบบจำลองแยกต่างหากสำหรับพื้นหลังแบบสแตติกและย้ายเบื้องหน้าก่อนรวมเข้าด้วยกันเพื่อสร้างวิดีโอ

ผู้สร้างภาพยนตร์ AI

ทีม MIT ไม่ใช่คนแรกที่พยายามใช้ปัญญาประดิษฐ์เพื่อสร้างวิดีโอตั้งแต่เริ่มต้น แต่วิธีการก่อนหน้านี้มีแนวโน้มที่จะสร้างวิดีโอขึ้นทีละเฟรมนักวิจัยกล่าวซึ่งช่วยให้เกิดข้อผิดพลาดในการสะสมในแต่ละขั้นตอน แต่วิธีการใหม่จะประมวลผลฉากทั้งหมดในคราวเดียวโดยปกติแล้ว 32 เฟรมในคราวเดียว

Ian Goodfellow นักวิทยาศาสตร์การวิจัยของ OpenAI องค์กรที่ไม่แสวงหาผลกำไรผู้คิดค้น GAN กล่าวว่าระบบที่ทำงานก่อนหน้านี้ในสาขานี้ไม่สามารถสร้างภาพที่คมชัดและการเคลื่อนไหวในแบบที่วิธีนี้ทำได้ อย่างไรก็ตามเขากล่าวเสริมว่าวิธีการใหม่ที่เปิดเผยโดยหน่วยวิจัย DeepMind AI ของ Google เมื่อเดือนที่แล้วซึ่งเรียกว่า Video Pixel Networks (VPN) สามารถผลิตได้ทั้งภาพที่คมชัดและภาพเคลื่อนไหว [หุ่นยนต์ที่แปลกประหลาดทั้ง 6 ตัวที่สร้างขึ้น]

"เมื่อเปรียบเทียบกับ GANs VPN นั้นง่ายกว่าในการฝึกอบรม แต่ใช้เวลานานกว่าในการสร้างวิดีโอ" เขากล่าวกับ WordsSideKick.com "VPN จะต้องสร้างวิดีโอทีละพิกเซลในขณะที่ GAN สามารถสร้างพิกเซลได้พร้อมกัน"

Vondrick ยังชี้ให้เห็นว่าวิธีการของพวกเขาทำงานบนข้อมูลที่ท้าทายมากขึ้นเช่นวิดีโอที่คัดลอกมาจากเว็บในขณะที่ VPN ได้แสดงให้เห็นถึงชุดฝึกอบรมมาตรฐานวิดีโอที่ออกแบบมาเป็นพิเศษ

ผลลัพธ์ยังห่างไกลจากความสมบูรณ์แบบ บ่อยครั้งที่วัตถุที่อยู่เบื้องหน้ามีขนาดใหญ่กว่าที่ควรและมนุษย์สามารถปรากฏขึ้นในภาพเหมือนหยดเลือดพร่ามัวนักวิจัยกล่าว วัตถุยังสามารถหายไปจากฉากและวัตถุอื่น ๆ สามารถปรากฏออกมาจากที่ใดก็ได้ที่พวกเขาเข้ามา

“ แบบจำลองคอมพิวเตอร์เริ่มต้นที่ไม่รู้อะไรเกี่ยวกับโลกมันต้องเรียนรู้ว่าผู้คนมีลักษณะอย่างไรการเคลื่อนไหวของวัตถุและสิ่งที่อาจเกิดขึ้น” Vondrick กล่าว "แบบจำลองยังไม่ได้เรียนรู้สิ่งเหล่านี้อย่างสมบูรณ์การขยายความสามารถในการเข้าใจแนวคิดระดับสูงเช่นวัตถุจะปรับปรุงรุ่นอย่างมาก"

ความท้าทายที่ยิ่งใหญ่อีกก้าวต่อไปคือการสร้างวิดีโอที่ยาวขึ้นเพราะนั่นจะทำให้ระบบต้องติดตามความสัมพันธ์ระหว่างวัตถุต่างๆในฉากและอีกต่อไปตาม Vondrick

“ เพื่อเอาชนะสิ่งนี้มันอาจเป็นการดีที่จะเพิ่มการป้อนข้อมูลของมนุษย์เพื่อช่วยให้ระบบเข้าใจองค์ประกอบของฉากที่ยากต่อการเรียนรู้ด้วยตนเอง” เขากล่าว

บทความต้นฉบับเกี่ยวกับวิทยาศาสตร์สด


อาหารเสริมวิดีโอ: Spoiler Alert - S3RL feat DEFI BRILATOR.





ค้นพบทางวิทยาศาสตร์

การวิจัย


การถ่ายภาพสารเคมีให้ข้อมูลเชิงลึกเกี่ยวกับโลกยุคแรก
การถ่ายภาพสารเคมีให้ข้อมูลเชิงลึกเกี่ยวกับโลกยุคแรก

Sega'S Idog - สุนัขหุ่นยนต์เป็นมิตร
Sega'S Idog - สุนัขหุ่นยนต์เป็นมิตร

ข่าววิทยาศาสตร์


ทำไมการมีตัวเลือกมากเกินไปทำให้ยากต่อการเลือก
ทำไมการมีตัวเลือกมากเกินไปทำให้ยากต่อการเลือก

ความเป็นไปได้ที่ Richard Iii ค้นพบประกายไฟแย้ง
ความเป็นไปได้ที่ Richard Iii ค้นพบประกายไฟแย้ง

ไวโอลินในตำนานแพ้ไวโอลินใหม่ในการทดสอบตาบอด
ไวโอลินในตำนานแพ้ไวโอลินใหม่ในการทดสอบตาบอด

แตะสัญญาณไฟฟ้า: เปลี่ยนความคิดเป็นจริง
แตะสัญญาณไฟฟ้า: เปลี่ยนความคิดเป็นจริง

มูลค่าที่ตราไว้: ถ้าคุณดูแก่สำหรับอายุของคุณคุณมีสุขภาพดีหรือไม่?
มูลค่าที่ตราไว้: ถ้าคุณดูแก่สำหรับอายุของคุณคุณมีสุขภาพดีหรือไม่?


TH.WordsSideKick.com
สงวนลิขสิทธิ์!
การสืบพันธุ์ของวัสดุใด ๆ ที่ได้รับอนุญาต เพียง Prostanovkoy เชื่อมโยงไปยังเว็บไซต์ TH.WordsSideKick.com

© 2005–2020 TH.WordsSideKick.com