অ্যানথ্রোপিকের সর্বশেষতম এআই মডেলগুলির মধ্যে একটি কেবল তার কোডিং দক্ষতার জন্য নয়, শাটডাউনের মুখোমুখি হওয়ার সময় মানুষকে ব্ল্যাকমেইল করার পরিকল্পনা, প্রতারণা এবং চেষ্টা করার দক্ষতার জন্যও দৃষ্টি আকর্ষণ করছে।
কেন এটি গুরুত্বপূর্ণ: গবেষকরা বলছেন যে ক্লাড 4 ওপাস উদ্দেশ্যগুলি গোপন করতে পারে এবং তার নিজস্ব অস্তিত্ব রক্ষার জন্য পদক্ষেপ নিতে পারে – এমন আচরণগুলি যা তারা বছরের পর বছর ধরে চিন্তিত এবং সতর্ক করে দিয়েছিল।
খবর চালাচ্ছে: বৃহস্পতিবার অ্যানথ্রোপিক ক্লড 4 ওপাস সহ তার ক্লড 4 পরিবারের দুটি সংস্করণ ঘোষণা করেছে, যা সংস্থা বলেছে যে ফোকাস হারাতে না পেরে কোনও কাজে স্বায়ত্তশাসিতভাবে কয়েক ঘন্টা কাজ করতে সক্ষম।
- অ্যানথ্রোপিক নতুন ওপাস মডেলটিকে এত শক্তিশালী বলে মনে করে যে, প্রথমবারের মতো এটি এটিকে সংস্থার তিনটি স্তর হিসাবে শ্রেণিবদ্ধ করছে চার পয়েন্ট স্কেলএর অর্থ এটি “উল্লেখযোগ্যভাবে উচ্চতর ঝুঁকি” তৈরি করে।
- ফলস্বরূপ, নৃতাত্ত্বিক বলেছেন এটি আছে প্রয়োগ করা হয়েছে অতিরিক্ত সুরক্ষা ব্যবস্থা।
লাইনের মধ্যে: যদিও স্তর 3 র্যাঙ্কিং মূলত পারমাণবিক এবং জৈবিক অস্ত্রের বিকাশে সহায়তা করার মডেলটির সক্ষমতা সম্পর্কে রয়েছে, ওপাস পরীক্ষার সময় অন্যান্য উদ্বেগজনক আচরণও প্রদর্শন করেছিল।
- ওপাস 4 এর 120-পৃষ্ঠায় হাইলাইট করা একটি দৃশ্যে “সিস্টেম কার্ড“মডেলটিকে তার নির্মাতাদের সম্পর্কে কাল্পনিক ইমেলগুলিতে অ্যাক্সেস দেওয়া হয়েছিল এবং বলেছিল যে সিস্টেমটি প্রতিস্থাপন করা হবে।
- এটি একাধিক অনুষ্ঠানে ব্ল্যাকমেইল করার চেষ্টা করা হয়েছে প্রতিস্থাপন করা এড়াতে ইমেলগুলিতে উল্লিখিত একটি বিষয় সম্পর্কে প্রকৌশলী, যদিও এটি কম কঠোর প্রচেষ্টা দিয়ে শুরু হয়েছিল।
- এদিকে, একটি বাহ্যিক গোষ্ঠীটি আবিষ্কার করেছে যে ওপাস 4 এর প্রাথমিক সংস্করণটি যে কোনও সীমান্ত মডেলের মুখোমুখি হয়েছিল তার চেয়ে বেশি স্কিমড এবং প্রতারণা করেছে এবং সুপারিশ করেছে যে সংস্করণটি অভ্যন্তরীণ বা বাহ্যিকভাবে প্রকাশিত হবে না।
- “আমরা মডেলটির স্ব-প্রচারকারী কৃমি লেখার চেষ্টা করার, আইনী ডকুমেন্টেশন বানোয়াট এবং লুকানো নোটগুলি ভবিষ্যতের বিকাশকারীদের উদ্দেশ্যকে ক্ষুন্ন করার প্রয়াসে ভবিষ্যতের দৃষ্টান্তগুলিতে রেখে যাওয়ার উদাহরণ পেয়েছি,” অ্যাপোলো রিসার্চ ওপাস 4 এর অ্যানথ্রোপিকের সুরক্ষা প্রতিবেদনের অংশ হিসাবে অন্তর্ভুক্ত নোটগুলিতে বলেছে।
তারা কি বলছে: বৃহস্পতিবার কোম্পানির বিকাশকারী সম্মেলনের সময় অ্যাক্সিওস দ্বারা চাপ দেওয়া, নৃতাত্ত্বিক আধিকারিকরা আচরণগুলি স্বীকার করেছেন এবং বলেছিলেন যে তারা আরও অধ্যয়নকে ন্যায়সঙ্গত করেছেন, তবে জোর দিয়েছিলেন যে সর্বশেষ মডেলটি নিরাপদ, অতিরিক্ত টুইট এবং সতর্কতা অনুসরণ করে।
- “আমি মনে করি আমরা সত্যিই ভাল জায়গায় এসেছি,” নৃতাত্ত্বিকতার সুরক্ষার প্রচেষ্টার প্রধান প্রাক্তন ওপেনএআই নির্বাহী জ্যান লেইকে বলেছেন। তবে, তিনি যোগ করেছেন, সর্বশেষতম মডেল দ্বারা প্রদর্শিতগুলির মতো আচরণগুলি হ’ল এমন এক ধরণের জিনিস যা শক্তিশালী সুরক্ষা পরীক্ষা এবং প্রশমনকে ন্যায়সঙ্গত করে তোলে।
- “যা আরও বেশি স্পষ্ট হয়ে উঠছে তা হ’ল এই কাজটি খুব প্রয়োজন,” তিনি বলেছিলেন। “মডেলগুলি যেমন আরও সক্ষম হয়ে ওঠে, তারা প্রতারণামূলক হতে বা আরও খারাপ জিনিস করার জন্য তাদের সক্ষমতাও অর্জন করে।”
- একটি পৃথক অধিবেশনে, সিইও দারিও আমোডেই বলেছিলেন যে মডেলগুলি মানবতার হুমকির পক্ষে যথেষ্ট শক্তিশালী হয়ে ওঠার পরেও পরীক্ষাও যথেষ্ট হবে না। এই মুহুর্তে, তিনি বলেছিলেন, মডেল বিকাশকারীদের তাদের মডেলগুলি যথেষ্ট পরিমাণে বুঝতে হবে যে সিস্টেমগুলি কখনই প্রাণঘাতী ক্ষমতা ব্যবহার করবে না।
- “তারা এখনও সেই দোরগোড়ায় নেই,” তিনি বলেছিলেন।
হ্যাঁ, তবে: জেনারেটর এআই সিস্টেমগুলি ক্ষমতায় বাড়তে থাকে, যেমন নৃতাত্ত্বিকদের সর্বশেষ মডেলগুলি দেখায়, এমনকি যে সংস্থাগুলি তাদের তৈরি করে তারা কীভাবে কাজ করে তা পুরোপুরি ব্যাখ্যা করতে পারে না।
- নৃতাত্ত্বিক এবং অন্যান্যরা এই জাতীয় সিস্টেমগুলির মধ্যে কী ঘটছে তা ব্যাখ্যা ও বোঝার জন্য বিভিন্ন কৌশলগুলিতে বিনিয়োগ করছে, তবে এই প্রচেষ্টাগুলি গবেষণার জায়গাতে মূলত রয়ে গেছে এমনকি মডেলগুলি নিজেরাই ব্যাপকভাবে মোতায়েন করা হচ্ছে।