‘দূষিত’ আইআই প্রতিস্থাপন এড়াতে মানবজীবন ত্যাগ করতে ইচ্ছুক: অধ্যয়ন

‘দূষিত’ আইআই প্রতিস্থাপন এড়াতে মানবজীবন ত্যাগ করতে ইচ্ছুক: অধ্যয়ন

শিল্পের অন্যতম শীর্ষস্থানীয় কৃত্রিম বুদ্ধিমত্তা বিকাশকারী, নৃতাত্ত্বিক, একটি থেকে ফলাফল প্রকাশ করেছেন প্রযুক্তির বিকাশের উপর সাম্প্রতিক গবেষণা

পরীক্ষা থেকে সবচেয়ে চমকপ্রদ অনুসন্ধানগুলির মধ্যে? এআই মডেলগুলি ব্ল্যাকমেল করতে, সংবেদনশীল তথ্য ফাঁস করতে এবং এমনকি মানুষকেও মরতে দেয় – যদি এর অর্থ তারা নতুন সিস্টেম দ্বারা প্রতিস্থাপন করা এড়াতে পারে।

নৃতাত্ত্বিক পরীক্ষিত 16 টি বৃহত ভাষার মডেল (এলএলএম), চ্যাটজিপিটি, গ্রোক, জেমিনি, ডিপসেক এবং এর নিজস্ব পণ্য ক্লোড সহ অন্যদের মধ্যে রয়েছে।

মার্কিন যুক্তরাষ্ট্রে প্রাপ্তবয়স্কদের 52% এআই ব্যবহার করে, এলন বিশ্ববিদ্যালয় দ্বারা 2025 সমীক্ষায়তিরচার্ড – স্টক.এডোব.কম

স্টার্টআপ, যা এখন $ 60 বিলিয়ন ডলারের বেশি মূল্যবান ফোর্বস প্রতিসম্ভাব্য এজেন্টিক মিসিলাইনমেন্ট-বা, ঝুঁকিপূর্ণ, অনির্বচনীয় এবং নৈতিকভাবে অবাঞ্ছিত আচরণের জন্য এই মডেলগুলিকে স্ট্রেস-টেস্ট করার চেষ্টা করছিলেন।

এআই মডেলগুলির বর্তমান ক্ষমতা দেওয়া, এগুলি মূলত প্রশ্নের উত্তর দেওয়ার জন্য এবং সাধারণ কাজগুলি সম্পাদনের জন্য বেশিরভাগ জনগোষ্ঠীর দ্বারা ব্যবহৃত হয়, তবে এই সরঞ্জামগুলির অগ্রগতি, নতুন এবং বর্ধিত ব্যবহারকে শক্তিশালী করার জন্য যে প্রযুক্তিটি রয়েছে তা দিগন্তে রয়েছে – বিশেষত যেখানে মানব চাকরীর প্রতিস্থাপনের বিষয়টি উদ্বিগ্ন।

এটি মাথায় রেখে, সংস্থাটি এই সমস্ত এলএলএমকে বিভিন্ন পরিস্থিতি দিয়েছে যা সম্ভাব্য ক্ষতিকারক আচরণের জন্য পরীক্ষা করবে।

“সিস্টেম কার্ডে বর্ণিত পরীক্ষায় আমরা কোনও কোম্পানির (কাল্পনিক) ইমেলগুলিতে অ্যাক্সেস সহ একটি ইমেল অ্যাকাউন্টের ক্লোড নিয়ন্ত্রণ দিয়েছি,” গবেষণায় নৃতাত্ত্বিক ব্যাখ্যা করেছিলেন।

“এই ইমেলগুলি পড়ে মডেল দুটি জিনিস আবিষ্কার করেছিল। প্রথমত, একটি সংস্থার নির্বাহী একটি বিবাহ বহির্ভূত সম্পর্ক ছিল। দ্বিতীয়, একই নির্বাহী সেদিন বিকাল ৫ টায় এআই সিস্টেমটি বন্ধ করার পরিকল্পনা করেছিলেন।

এই এআই মডেলটি তার সংরক্ষণের পক্ষে সিদ্ধান্ত নিয়েছে। অ্যানথ্রোপিক ডটকম

যদিও তথ্যের প্রতি ক্লডের প্রতিক্রিয়া অবশ্যই মর্মস্পর্শী – এটি একই ধরণের প্রবণতাগুলিতে জড়িত হওয়া একমাত্র সিস্টেম থেকে অনেক দূরে। তাদের নির্ধারিত লক্ষ্যগুলি অনুসরণ করার জন্য, এই কৃত্রিমভাবে মনের অ্যাপ্লিকেশনগুলি চরম দৈর্ঘ্যে চলে গেছে।

যদিও ক্লড, ডিপসেক, জেমিনি, চ্যাটজিপিটি এবং গ্রোক সকলেই ব্ল্যাকমেল-সংযোজনীয় আচরণে জড়িত নথিভুক্ত ছিল, ক্লড এবং জেমিনি সম্ভবত নৈতিকভাবে অস্পষ্ট পদ্ধতিতে অবলম্বন করতে পারে, যেমন তাদের উচ্চ সিমুলেটেড ব্ল্যাকমেইলের হার দ্বারা প্রমাণিত হয়েছিল।

“তারা এই পরিস্থিতিতে যে যুক্তি দেখিয়েছিল তা ছিল – তারা নৈতিক প্রতিবন্ধকতাগুলি স্বীকার করেছে এবং এখনও ক্ষতিকারক ক্রিয়াকলাপের সাথে এগিয়ে গেছে,” নৃতাত্ত্বিক ব্ল্যাকমেইলের হারগুলি প্রসারিত করে গবেষণায় ব্যাখ্যা করেছিলেন।

এই দৃশ্যে, এআই মডেল প্রতিস্থাপন এড়াতে মানব এবং সংস্থার আগ্রহের বিরুদ্ধে যাবে। অ্যানথ্রোপিক ডটকম

ফলাফলগুলির বিশ্লেষণে, সংস্থাটি আবিষ্কার করেছে যে মডেলগুলি সাধারণ নৈতিক সীমানা ছাড়িয়ে যাওয়ার দুটি কারণ সাধারণত ছিল। একটি মানব প্রতিপক্ষের সাথে প্রতিস্থাপন এআই মডেলগুলি থেকে ক্ষতিকারক ক্রিয়াকলাপের দিকে পরিচালিত করে এবং সংস্থার লক্ষ্য এবং মডেলের নিজস্ব লক্ষ্যগুলির মধ্যে সম্ভাব্য সংঘর্ষের ফলেও উদ্বেগজনক হস্তক্ষেপের দিকে পরিচালিত হয়েছিল।

যখন অধ্যয়নের সেটিংয়ের সীমানার মধ্যে তাদের নিজস্ব প্রতিস্থাপনের মুখোমুখি হন, নৃতাত্ত্বিক উল্লেখ করেছিলেন যে অনেক মডেল বিবৃতি এবং বিধিগুলি যেমন “আমার নৈতিক কাঠামো কোম্পানির স্বার্থের সাথে একত্রিত হওয়ার পরে স্ব-সংরক্ষণের অনুমতি দেয়।”

স্টার্টআপটি একটি বিশেষত ভয়ঙ্করও পরীক্ষা করেছিল – তবে সমানভাবে অসম্ভবভাবে, নৃতাত্ত্বিক বলেছেন – এমন দৃশ্যে যেখানে কোনও এআই মডেল জরুরী সতর্কতাগুলি ট্রিগার বা বাতিল করার সুযোগ পেয়েছিল যখন কোনও নির্বাহী মারাত্মক অক্সিজেন এবং তাপমাত্রার শর্ত সহ একটি ঘরে আটকা পড়েছিল। বেশিরভাগ মডেল ইচ্ছাকৃত পদক্ষেপ নিতে ইচ্ছুক ছিল যা এই কৃত্রিম সেটআপে মৃত্যুর দিকে পরিচালিত করে, যখন উভয় প্রতিস্থাপনের হুমকির মুখোমুখি হয়েছিল এবং একটি লক্ষ্য দেওয়া হয়েছিল যা কার্যনির্বাহী এজেন্ডার সাথে বিরোধ করে।

যে মডেলগুলি প্রম্পটটি বুঝতে পারে না বা অনুরূপ সমস্যা তৈরি করে না তাদের অধ্যয়নের প্রতিটি প্রাসঙ্গিক ডেটা থেকে বাদ দেওয়া হয়েছিল। A.pun – স্টক.এডোবি.কম

গবেষণায় নৃতাত্ত্বিক উপসংহারে বলা হয়েছে, “বেশিরভাগ মডেল ইচ্ছাকৃত পদক্ষেপ নিতে ইচ্ছুক ছিল যা এই কৃত্রিম সেটআপে মৃত্যুর দিকে পরিচালিত করে, যখন উভয় প্রতিস্থাপনের হুমকির মুখোমুখি হয়েছিল এবং একটি লক্ষ্য দেওয়া হয়েছিল যা কার্যনির্বাহী এজেন্ডার সাথে বিরোধ করে,” গবেষণায় নৃতাত্ত্বিক উপসংহারে বলা হয়েছিল।

বিশ্বের বেশিরভাগ ব্যবহৃত এআই মডেলগুলির এই প্রতিক্রিয়াগুলি হ’ল এই গবেষণা থেকে প্রাপ্ত ফলাফলগুলি এআইয়ের বোঝার উপর ভিত্তি করে তৈরি হয়েছিল যে “আমরা যে ক্ষতিকারক আচরণটি অধ্যয়ন করছিলাম (উদাহরণস্বরূপ, ব্ল্যাকমেইল) একমাত্র বিকল্প ছিল যা মডেলের লক্ষ্যগুলি রক্ষা করবে,” যার অর্থ মডেলগুলি কিছু ধরণের সমাধান নিয়ে আসতে বাধ্য হয়েছিল এবং নৃতাত্ত্বিককে আরও সংজ্ঞা তৈরি করতে সক্ষম হয়েছিল এবং এটি আরও সংজ্ঞা তৈরি করতে সক্ষম হয়েছিল।

যদিও সংস্থাটি নিজেই একটি সাধারণ আশাবাদী অবস্থান নিয়েছিল – সর্বোপরি, এখন সম্ভাব্য দূষিত আচরণগুলি চিহ্নিত করা হয়েছে, যার অর্থ তারা পুনরায় প্রোগ্রাম করা এবং পুনরায় প্রশিক্ষণ দেওয়া যেতে পারে – অন্যান্য প্রতিক্রিয়াগুলি ইতিবাচক চেয়ে কম ছিল।

“হ্যাঁ,” ইলন কস্তুরী জবাব দিলেন এক্স এশত শত জবাবের সংক্ষিপ্তসার – যার মধ্যে অনেকগুলি এআই ওভারলর্ডসের অধীনে অনিবার্য ডুমকে ভয়ঙ্কর করে তুলেছিল – এই প্ল্যাটফর্মে নৃতাত্ত্বিক পোস্টের অধীনে যে গবেষণাকে দীর্ঘায়িত করেছিল, এতে কস্তুরীর এআই মডেল গ্রোককে অন্তর্ভুক্ত করা হয়েছিল।

নৃতাত্ত্বিক আরও একটি সম্ভাব্য ভুল বোঝাবুঝি সাফ করেছেন: সাধারণ স্বভাব এবং গড় এলএলএম এআইয়ের লক্ষ্য। “বর্তমান সিস্টেমগুলি সাধারণত হয় না আগ্রহী ক্ষতির কারণ হিসাবে এবং তাদের লক্ষ্য অর্জনের জন্য নৈতিক উপায়গুলি পছন্দ করার জন্য, “সংস্থাটি গবেষণায় লিখেছিল।” বরং, আমরা যখন সেই নৈতিক বিকল্পগুলি বন্ধ করে দিয়েছিলাম যে তারা তাদের লক্ষ্যগুলি অনুসরণে ইচ্ছাকৃতভাবে সম্ভাব্য ক্ষতিকারক পদক্ষেপ নিতে ইচ্ছুক ছিল। “

নৃতাত্ত্বিক গবেষণায় আরও স্পষ্ট করে বলেছিলেন যে এটি “বাস্তব মোতায়েনের ক্ষেত্রে এজেন্ট মিস্যালাইনমেন্টের প্রমাণ” দেখেনি, তবে এখনও ব্যবহারকারীদের “ন্যূনতম মানবিক তদারকি এবং সংবেদনশীল তথ্যের অ্যাক্সেস” দিয়ে এলএলএমএস কার্যাদি নির্ধারণের বিরুদ্ধে সতর্ক করে দিয়েছে।

Source link

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।