ხელოვნური ინტელექტის მოდელებით "კომპანია" შექმნეს - ნახეთ, ექსპერიმენტის შედეგი

რობოტებუ

ზოგიერთ ადამიანს ეშინია, რომ  მომავალში ხელოვნური ინტელექტი ყველა სამუშაო ადგილს დაიკავებს და შემოსავლის წყაროს გარეშე დაგვტოვებს. თუმცა, ნაკლებად სავარაუდოა, რომ ეს მალე მოხდეს, რასაც თამამი ექსპერიმენტის შედეგებიც ადასტურებს, წერს  Futurism .

აღსანიშნავია, რომ კარნეგი მელონის უნივერსიტეტის მეცნიერებმა შექმნეს ყალბი კომპანია TheAgentCompany, რომელიც პროგრამულ უზრუნველყოფას ავითარებს. მისი ყველა თანამშრომელი ხელოვნური ინტელექტის მოდელია, რომლებიც შექმნილია დავალებების დამოუკიდებლად შესასრულებლად. ამ ექსპერიმენტის შედეგები საკმაოდ ქაოტური იყო.

TheAgentCompany-ში დასაქმებულია Google-ის, OpenAI-ის, Anthropic-ის და Meta-ს ხელოვნური მუშაკები. მათ ფინანსური ანალიტიკოსების, პროგრამული უზრუნველყოფის ინჟინრებისა და პროექტის მენეჯერების როლები აიღეს და ისეთ სიმულაციურ კოლეგებთან ერთად მუშაობდნენ, როგორიცაა ყალბი ადამიანური რესურსების დეპარტამენტი და მთავარი ტექნოლოგიების დირექტორი.

მეცნიერებმა TheAgentCompany-ის „თანამშრომლებს“ რეალური IT კომპანიის ყოველდღიური მუშაობის საფუძველზე დაუსახეს ამოცანები. ხელოვნური ინტელექტის მოდელები ნავიგაციას ახდენდნენ ფაილების დირექტორიებში, ვირტუალურად ამოწმებდნენ ახალ საოფისე სივრცეებს ​​და შეგროვებული უკუკავშირის საფუძველზე წერდნენ პროგრამული უზრუნველყოფის ინჟინრების ნამუშევრების მიმოხილვებს.

გამოცემამ გააზიარა, რომ საუკეთესო მოდელი Anthropic-ის Claude 3.5 Sonnet იყო. თუმცა, მან დაკისრებული დავალებების მხოლოდ 24% შეასრულა. ერთი დავალების შესასრულებლად, მოდელს დაახლოებით 30 ნაბიჯის გადადგმა მოუწია.

Google-ის Gemini 2.0 Flash მოდელის მიხედვით, თითოეული შესრულებული დავალების შესრულება საშუალოდ 40 ნაბიჯს მოიცავდა. მათგან მხოლოდ 11.4% დასრულდა წარმატებით.

ხელოვნური ინტელექტის ყველაზე ცუდი მუშაკი Amazon-ის Nova Pro v1 იყო. ერთი დავალების შესასრულებლად ის საშუალოდ 20 ნაბიჯს დგამდა, თუმცა მათი შესრულების წარმატების მაჩვენებელი მხოლოდ 1.7% იყო.

მეცნიერები ამბობენ, რომ ხელოვნური ინტელექტის აგენტებს საღი აზრის ნაკლებობა, სუსტი სოციალური უნარები და ინტერნეტში ნავიგაციის ცუდი გაგება აქვთ. ასევე, ნეირონული ქსელები ხშირად უქმნიდნენ საკუთარ თავს დაბრკოლებებს, ცდილობდნენ ამოცანების შესასრულებლად მოკლე გზების პოვნას.