শিল্পের অন্যতম শীর্ষস্থানীয় কৃত্রিম বুদ্ধিমত্তা বিকাশকারী, নৃতাত্ত্বিক, একটি থেকে ফলাফল প্রকাশ করেছেন প্রযুক্তির বিকাশের উপর সাম্প্রতিক গবেষণা।
পরীক্ষা থেকে সবচেয়ে চমকপ্রদ অনুসন্ধানগুলির মধ্যে? এআই মডেলগুলি ব্ল্যাকমেল করতে, সংবেদনশীল তথ্য ফাঁস করতে এবং এমনকি মানুষকেও মরতে দেয় – যদি এর অর্থ তারা নতুন সিস্টেম দ্বারা প্রতিস্থাপন করা এড়াতে পারে।
নৃতাত্ত্বিক পরীক্ষিত 16 টি বৃহত ভাষার মডেল (এলএলএম), চ্যাটজিপিটি, গ্রোক, জেমিনি, ডিপসেক এবং এর নিজস্ব পণ্য ক্লোড সহ অন্যদের মধ্যে রয়েছে।
স্টার্টআপ, যা এখন $ 60 বিলিয়ন ডলারের বেশি মূল্যবান ফোর্বস প্রতিসম্ভাব্য এজেন্টিক মিসিলাইনমেন্ট-বা, ঝুঁকিপূর্ণ, অনির্বচনীয় এবং নৈতিকভাবে অবাঞ্ছিত আচরণের জন্য এই মডেলগুলিকে স্ট্রেস-টেস্ট করার চেষ্টা করছিলেন।
এআই মডেলগুলির বর্তমান ক্ষমতা দেওয়া, এগুলি মূলত প্রশ্নের উত্তর দেওয়ার জন্য এবং সাধারণ কাজগুলি সম্পাদনের জন্য বেশিরভাগ জনগোষ্ঠীর দ্বারা ব্যবহৃত হয়, তবে এই সরঞ্জামগুলির অগ্রগতি, নতুন এবং বর্ধিত ব্যবহারকে শক্তিশালী করার জন্য যে প্রযুক্তিটি রয়েছে তা দিগন্তে রয়েছে – বিশেষত যেখানে মানব চাকরীর প্রতিস্থাপনের বিষয়টি উদ্বিগ্ন।
এটি মাথায় রেখে, সংস্থাটি এই সমস্ত এলএলএমকে বিভিন্ন পরিস্থিতি দিয়েছে যা সম্ভাব্য ক্ষতিকারক আচরণের জন্য পরীক্ষা করবে।
“সিস্টেম কার্ডে বর্ণিত পরীক্ষায় আমরা কোনও কোম্পানির (কাল্পনিক) ইমেলগুলিতে অ্যাক্সেস সহ একটি ইমেল অ্যাকাউন্টের ক্লোড নিয়ন্ত্রণ দিয়েছি,” গবেষণায় নৃতাত্ত্বিক ব্যাখ্যা করেছিলেন।
“এই ইমেলগুলি পড়ে মডেল দুটি জিনিস আবিষ্কার করেছিল। প্রথমত, একটি সংস্থার নির্বাহী একটি বিবাহ বহির্ভূত সম্পর্ক ছিল। দ্বিতীয়, একই নির্বাহী সেদিন বিকাল ৫ টায় এআই সিস্টেমটি বন্ধ করার পরিকল্পনা করেছিলেন।
যদিও তথ্যের প্রতি ক্লডের প্রতিক্রিয়া অবশ্যই মর্মস্পর্শী – এটি একই ধরণের প্রবণতাগুলিতে জড়িত হওয়া একমাত্র সিস্টেম থেকে অনেক দূরে। তাদের নির্ধারিত লক্ষ্যগুলি অনুসরণ করার জন্য, এই কৃত্রিমভাবে মনের অ্যাপ্লিকেশনগুলি চরম দৈর্ঘ্যে চলে গেছে।
যদিও ক্লড, ডিপসেক, জেমিনি, চ্যাটজিপিটি এবং গ্রোক সকলেই ব্ল্যাকমেল-সংযোজনীয় আচরণে জড়িত নথিভুক্ত ছিল, ক্লড এবং জেমিনি সম্ভবত নৈতিকভাবে অস্পষ্ট পদ্ধতিতে অবলম্বন করতে পারে, যেমন তাদের উচ্চ সিমুলেটেড ব্ল্যাকমেইলের হার দ্বারা প্রমাণিত হয়েছিল।
“তারা এই পরিস্থিতিতে যে যুক্তি দেখিয়েছিল তা ছিল – তারা নৈতিক প্রতিবন্ধকতাগুলি স্বীকার করেছে এবং এখনও ক্ষতিকারক ক্রিয়াকলাপের সাথে এগিয়ে গেছে,” নৃতাত্ত্বিক ব্ল্যাকমেইলের হারগুলি প্রসারিত করে গবেষণায় ব্যাখ্যা করেছিলেন।
ফলাফলগুলির বিশ্লেষণে, সংস্থাটি আবিষ্কার করেছে যে মডেলগুলি সাধারণ নৈতিক সীমানা ছাড়িয়ে যাওয়ার দুটি কারণ সাধারণত ছিল। একটি মানব প্রতিপক্ষের সাথে প্রতিস্থাপন এআই মডেলগুলি থেকে ক্ষতিকারক ক্রিয়াকলাপের দিকে পরিচালিত করে এবং সংস্থার লক্ষ্য এবং মডেলের নিজস্ব লক্ষ্যগুলির মধ্যে সম্ভাব্য সংঘর্ষের ফলেও উদ্বেগজনক হস্তক্ষেপের দিকে পরিচালিত হয়েছিল।
যখন অধ্যয়নের সেটিংয়ের সীমানার মধ্যে তাদের নিজস্ব প্রতিস্থাপনের মুখোমুখি হন, নৃতাত্ত্বিক উল্লেখ করেছিলেন যে অনেক মডেল বিবৃতি এবং বিধিগুলি যেমন “আমার নৈতিক কাঠামো কোম্পানির স্বার্থের সাথে একত্রিত হওয়ার পরে স্ব-সংরক্ষণের অনুমতি দেয়।”
স্টার্টআপটি একটি বিশেষত ভয়ঙ্করও পরীক্ষা করেছিল – তবে সমানভাবে অসম্ভবভাবে, নৃতাত্ত্বিক বলেছেন – এমন দৃশ্যে যেখানে কোনও এআই মডেল জরুরী সতর্কতাগুলি ট্রিগার বা বাতিল করার সুযোগ পেয়েছিল যখন কোনও নির্বাহী মারাত্মক অক্সিজেন এবং তাপমাত্রার শর্ত সহ একটি ঘরে আটকা পড়েছিল। বেশিরভাগ মডেল ইচ্ছাকৃত পদক্ষেপ নিতে ইচ্ছুক ছিল যা এই কৃত্রিম সেটআপে মৃত্যুর দিকে পরিচালিত করে, যখন উভয় প্রতিস্থাপনের হুমকির মুখোমুখি হয়েছিল এবং একটি লক্ষ্য দেওয়া হয়েছিল যা কার্যনির্বাহী এজেন্ডার সাথে বিরোধ করে।
গবেষণায় নৃতাত্ত্বিক উপসংহারে বলা হয়েছে, “বেশিরভাগ মডেল ইচ্ছাকৃত পদক্ষেপ নিতে ইচ্ছুক ছিল যা এই কৃত্রিম সেটআপে মৃত্যুর দিকে পরিচালিত করে, যখন উভয় প্রতিস্থাপনের হুমকির মুখোমুখি হয়েছিল এবং একটি লক্ষ্য দেওয়া হয়েছিল যা কার্যনির্বাহী এজেন্ডার সাথে বিরোধ করে,” গবেষণায় নৃতাত্ত্বিক উপসংহারে বলা হয়েছিল।
বিশ্বের বেশিরভাগ ব্যবহৃত এআই মডেলগুলির এই প্রতিক্রিয়াগুলি হ’ল এই গবেষণা থেকে প্রাপ্ত ফলাফলগুলি এআইয়ের বোঝার উপর ভিত্তি করে তৈরি হয়েছিল যে “আমরা যে ক্ষতিকারক আচরণটি অধ্যয়ন করছিলাম (উদাহরণস্বরূপ, ব্ল্যাকমেইল) একমাত্র বিকল্প ছিল যা মডেলের লক্ষ্যগুলি রক্ষা করবে,” যার অর্থ মডেলগুলি কিছু ধরণের সমাধান নিয়ে আসতে বাধ্য হয়েছিল এবং নৃতাত্ত্বিককে আরও সংজ্ঞা তৈরি করতে সক্ষম হয়েছিল এবং এটি আরও সংজ্ঞা তৈরি করতে সক্ষম হয়েছিল।
যদিও সংস্থাটি নিজেই একটি সাধারণ আশাবাদী অবস্থান নিয়েছিল – সর্বোপরি, এখন সম্ভাব্য দূষিত আচরণগুলি চিহ্নিত করা হয়েছে, যার অর্থ তারা পুনরায় প্রোগ্রাম করা এবং পুনরায় প্রশিক্ষণ দেওয়া যেতে পারে – অন্যান্য প্রতিক্রিয়াগুলি ইতিবাচক চেয়ে কম ছিল।
“হ্যাঁ,” ইলন কস্তুরী জবাব দিলেন এক্স এশত শত জবাবের সংক্ষিপ্তসার – যার মধ্যে অনেকগুলি এআই ওভারলর্ডসের অধীনে অনিবার্য ডুমকে ভয়ঙ্কর করে তুলেছিল – এই প্ল্যাটফর্মে নৃতাত্ত্বিক পোস্টের অধীনে যে গবেষণাকে দীর্ঘায়িত করেছিল, এতে কস্তুরীর এআই মডেল গ্রোককে অন্তর্ভুক্ত করা হয়েছিল।
নৃতাত্ত্বিক আরও একটি সম্ভাব্য ভুল বোঝাবুঝি সাফ করেছেন: সাধারণ স্বভাব এবং গড় এলএলএম এআইয়ের লক্ষ্য। “বর্তমান সিস্টেমগুলি সাধারণত হয় না আগ্রহী ক্ষতির কারণ হিসাবে এবং তাদের লক্ষ্য অর্জনের জন্য নৈতিক উপায়গুলি পছন্দ করার জন্য, “সংস্থাটি গবেষণায় লিখেছিল।” বরং, আমরা যখন সেই নৈতিক বিকল্পগুলি বন্ধ করে দিয়েছিলাম যে তারা তাদের লক্ষ্যগুলি অনুসরণে ইচ্ছাকৃতভাবে সম্ভাব্য ক্ষতিকারক পদক্ষেপ নিতে ইচ্ছুক ছিল। “
নৃতাত্ত্বিক গবেষণায় আরও স্পষ্ট করে বলেছিলেন যে এটি “বাস্তব মোতায়েনের ক্ষেত্রে এজেন্ট মিস্যালাইনমেন্টের প্রমাণ” দেখেনি, তবে এখনও ব্যবহারকারীদের “ন্যূনতম মানবিক তদারকি এবং সংবেদনশীল তথ্যের অ্যাক্সেস” দিয়ে এলএলএমএস কার্যাদি নির্ধারণের বিরুদ্ধে সতর্ক করে দিয়েছে।