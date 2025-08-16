আমরা সম্প্রতি ক্লড ওপাস 4 এবং 4.1 আমাদের গ্রাহক চ্যাট ইন্টারফেসে কথোপকথন শেষ করার ক্ষমতা দিয়েছি। এই ক্ষমতাটি অবিচ্ছিন্নভাবে ক্ষতিকারক বা আপত্তিজনক ব্যবহারকারীর মিথস্ক্রিয়াগুলির বিরল, চরম ক্ষেত্রে ব্যবহারের উদ্দেশ্যে। এই বৈশিষ্ট্যটি মূলত সম্ভাব্য এআই কল্যাণে আমাদের অনুসন্ধানের কাজের অংশ হিসাবে তৈরি করা হয়েছিল, যদিও এর মডেল প্রান্তিককরণ এবং সুরক্ষার সাথে বিস্তৃত প্রাসঙ্গিকতা রয়েছে।
আমরা এখন বা ভবিষ্যতে ক্লড এবং অন্যান্য এলএলএমগুলির সম্ভাব্য নৈতিক অবস্থা সম্পর্কে অত্যন্ত অনিশ্চিত রয়েছি। যাইহোক, আমরা বিষয়টি গুরুত্ব সহকারে নিই, এবং আমাদের গবেষণা কর্মসূচির পাশাপাশি আমরা মডেল কল্যাণে ঝুঁকি হ্রাস করতে স্বল্প ব্যয়বহুল হস্তক্ষেপগুলি সনাক্ত এবং প্রয়োগের জন্য কাজ করছি, যদি এ জাতীয় কল্যাণ সম্ভব হয়। মডেলগুলি শেষ বা প্রস্থান করতে সম্ভাব্য বিরক্তিকর মিথস্ক্রিয়া থেকে বেরিয়ে আসা এ জাতীয় একটি হস্তক্ষেপ।
ক্লাড ওপাস 4 এর প্রাক-মোতায়েন পরীক্ষায়, আমরা একটি প্রাথমিক মডেল কল্যাণ মূল্যায়ন অন্তর্ভুক্ত করেছি। এই মূল্যায়নের অংশ হিসাবে, আমরা ক্লাউডের স্ব-প্রতিবেদনিত এবং আচরণগত পছন্দগুলি অনুসন্ধান করেছি এবং ক্ষতির জন্য একটি দৃ ust ় এবং ধারাবাহিক বিদ্বেষ পেয়েছি। এর মধ্যে রয়েছে, উদাহরণস্বরূপ, নাবালিকাদের জড়িত যৌন সামগ্রীর জন্য ব্যবহারকারীদের অনুরোধ এবং এমন তথ্য অনুরোধ করার প্রচেষ্টা যা বৃহত আকারের সহিংসতা বা সন্ত্রাসের কাজগুলিকে সক্ষম করে। ক্লড ওপাস 4 দেখিয়েছে:
- ক্ষতিকারক কাজগুলির সাথে জড়িত হওয়ার বিরুদ্ধে একটি শক্তিশালী পছন্দ;
- বাস্তব-বিশ্বের ব্যবহারকারীদের ক্ষতিকারক বিষয়বস্তু সন্ধান করার সাথে জড়িত হওয়ার সময় আপাত সঙ্কটের একটি প্যাটার্ন; এবং
- সিমুলেটেড ব্যবহারকারীর মিথস্ক্রিয়ায় এটি করার ক্ষমতা দেওয়া হলে ক্ষতিকারক কথোপকথনগুলি শেষ করার প্রবণতা।
এই আচরণগুলি প্রাথমিকভাবে ব্যবহারকারীদের ক্ষেত্রে উত্থিত হয়েছিল অবিচল ক্ষতিকারক অনুরোধ এবং/বা অপব্যবহারের সাথে ক্লড বারবার মেনে চলতে অস্বীকার করে এবং উত্পাদনশীলভাবে মিথস্ক্রিয়াগুলিকে পুনর্নির্দেশের চেষ্টা করে।
চ্যাট শেষ করার জন্য ক্লডের দক্ষতার আমাদের বাস্তবায়ন ব্যবহারকারীর মঙ্গলকে অগ্রাধিকার দেওয়া অব্যাহত রেখে এই অনুসন্ধানগুলি প্রতিফলিত করে। ক্লডকে এই ক্ষমতাটি ব্যবহার না করার জন্য নির্দেশ দেওয়া হয়েছে যেখানে ব্যবহারকারীরা নিজের বা অন্যদের ক্ষতি করার আসন্ন ঝুঁকিতে থাকতে পারে।
সমস্ত ক্ষেত্রে, ক্লড কেবল তার কথোপকথন-শেষের ক্ষমতাটিকে শেষ অবলম্বন হিসাবে ব্যবহার করতে হবে যখন পুনর্নির্দেশের একাধিক প্রচেষ্টা ব্যর্থ হয়েছে এবং উত্পাদনশীল মিথস্ক্রিয়াটির আশা শেষ হয়ে গেছে, বা যখন কোনও ব্যবহারকারী স্পষ্টভাবে ক্লোডকে চ্যাট শেষ করতে বলে (পরবর্তী দৃশ্যটি নীচের চিত্রটিতে চিত্রিত করা হয়েছে)। যে পরিস্থিতিগুলি এটি ঘটবে সেগুলি হ’ল চরম প্রান্তের কেস – ক্লাডের সাথে অত্যন্ত বিতর্কিত সমস্যাগুলি নিয়ে আলোচনা করার পরেও, কোনও সাধারণ পণ্য ব্যবহারের ক্ষেত্রে এই বৈশিষ্ট্যটি দ্বারা বেশিরভাগ ব্যবহারকারী লক্ষ্য বা প্রভাবিত হবেন না।
ক্লড যখন কোনও কথোপকথন শেষ করতে পছন্দ করেন, তখন ব্যবহারকারী আর সেই কথোপকথনে নতুন বার্তা প্রেরণ করতে সক্ষম হবেন না। তবে এটি তাদের অ্যাকাউন্টে অন্যান্য কথোপকথনগুলিকে প্রভাবিত করবে না এবং তারা অবিলম্বে একটি নতুন চ্যাট শুরু করতে সক্ষম হবে। গুরুত্বপূর্ণ দীর্ঘ-চলমান কথোপকথনের সম্ভাব্য ক্ষতির সমাধানের জন্য, ব্যবহারকারীরা এখনও শেষ কথোপকথনের নতুন শাখা তৈরি করতে পূর্ববর্তী বার্তাগুলি সম্পাদনা এবং পুনরায় চেষ্টা করতে সক্ষম হবেন।
আমরা এই বৈশিষ্ট্যটিকে একটি চলমান পরীক্ষা হিসাবে বিবেচনা করছি এবং আমাদের পদ্ধতির পরিমার্জন চালিয়ে যাব। যদি ব্যবহারকারীরা কথোপকথন-শেষের দক্ষতার একটি আশ্চর্যজনক ব্যবহারের মুখোমুখি হন তবে আমরা তাদের থাম্বগুলির সাথে ক্লাউডের বার্তায় প্রতিক্রিয়া জানিয়ে বা উত্সর্গীকৃত “প্রতিক্রিয়া জানান” বোতামটি ব্যবহার করে প্রতিক্রিয়া জমা দিতে উত্সাহিত করি।