এআই সংস্থাগুলির জন্য বটস ফসল সংগ্রহের সামগ্রীটি এই পর্যায়ে পৌঁছেছে যে তারা শিল্প ও সংস্কৃতির ডিজিটাল সংগ্রহের হুমকি দিচ্ছে।
গ্যালারী, গ্রন্থাগার, সংরক্ষণাগার এবং যাদুঘরগুলি (গ্ল্যামস) বলছে যে তারা এআই বট দ্বারা অভিভূত হচ্ছে – ওয়েব ক্রলিং স্ক্রিপ্টগুলি যা ওয়েবসাইটগুলি পরিদর্শন করে এবং এআই মডেলগুলির প্রশিক্ষণের জন্য ডেটা ডাউনলোড করার জন্য ডেটা ডাউনলোড করে – অনুসারে – অনুযায়ী একটি প্রতিবেদন মঙ্গলবার গ্ল্যাম-ই ল্যাব দ্বারা জারি করা হয়েছে, যা গ্ল্যামগুলিকে প্রভাবিত করে এমন সমস্যাগুলি অধ্যয়ন করে।
গ্ল্যাম-ই ল্যাব হ’ল এনওয়াইইউ আইনে ইনোভেশন আইন ও নীতি সম্পর্কিত ইনোভেশন আইন ও নীতি সম্পর্কিত কেন্দ্রের বিজ্ঞান, সংস্কৃতি এবং আইনের মধ্যে একটি যৌথ উদ্যোগ।
৪৩ টি সংস্থার বেনামে জরিপের ভিত্তিতে, প্রতিবেদনটি ইঙ্গিত দেয় যে সাংস্কৃতিক প্রতিষ্ঠানগুলি তাদের বিষয়বস্তুর আক্রমণাত্মক ফসল কাটার কারণে উদ্বেগজনক, যা ওয়েবসাইটগুলিতে ডেটা-সংগ্রহের জায়গাগুলি বোঝার জন্য কোনও বিবেচনা করে না।
প্রতিবেদনে বলা হয়েছে, “বটগুলি সর্বজনীন না হলেও বিস্তৃত।” “43 জন উত্তরদাতাদের মধ্যে 39 জন ট্র্যাফিকের সাম্প্রতিক বৃদ্ধি পেয়েছিলেন। 39 জন উত্তরদাতাদের মধ্যে সাতাশটি ট্র্যাফিক বৃদ্ধির অভিজ্ঞতা অর্জন করে এটি এআই প্রশিক্ষণ ডেটা বটকে দায়ী করেছে, অতিরিক্ত সাতটি বিশ্বাস করে যে বটগুলি ট্র্যাফিকের ক্ষেত্রে অবদান রাখতে পারে।”
এআই প্রশিক্ষণের জন্য ডেটা সংগ্রহকারী বটগুলিতে উত্থান, প্রতিবেদনে বলা হয়েছে, এটি প্রায়শই নজরে না যাওয়া পর্যন্ত এটি এতটা খারাপ হয়ে যায় যে এটি অনলাইন সংগ্রহগুলি অফলাইনে নক করে।
প্রতিবেদনে বলা হয়েছে, “উত্তরদাতারা আশঙ্কা করছেন যে এআই প্রশিক্ষণ ডেটা বটগুলির ঝাঁকগুলি সংগ্রহগুলিতে অনলাইন অ্যাক্সেস সরবরাহের জন্য অস্থিতিশীলভাবে ব্যয় বাড়ানোর পরিবেশ তৈরি করবে,” প্রতিবেদনে বলা হয়েছে।
এই উদ্বেগগুলির বিষয়ে মন্তব্য করা প্রতিষ্ঠানগুলির বট সার্জ শুরু হওয়ার বিষয়ে বিভিন্ন মতামত রয়েছে। 2021 সালে এটি লক্ষ্য করে কিছু রিপোর্ট করেছে যে অন্যরা কেবল এই বছর ওয়েব স্ক্র্যাপার ট্র্যাফিক লক্ষ্য করা শুরু করেছে।
কিছু বট নিজেকে চিহ্নিত করে, তবে কিছু না। যেভাবেই হোক, উত্তরদাতারা বলেছেন যে রোবটস.টেক্সট নির্দেশিকা – স্বেচ্ছাসেবী আচরণের নির্দেশিকা যা ওয়েব প্রকাশকরা ওয়েব ক্রোলারদের জন্য পোস্ট করেন – বর্তমানে বট ঝাঁকগুলি নিয়ন্ত্রণে কার্যকর নয়।
এডাব্লুএস এবং ক্লাউডফ্লেয়ারের পছন্দগুলি দ্বারা প্রদত্ত বট ডিফেন্সগুলি সহায়তা করে বলে মনে হয় তবে গ্ল্যাম-ই ল্যাব স্বীকার করে যে সমস্যাটি জটিল। কোনও প্রতিষ্ঠানের লক্ষ্য ডিজিটাল সম্পদে জনসাধারণের অ্যাক্সেস সরবরাহ করা হলে কোনও লগইনের পিছনে সামগ্রী স্থাপন কার্যকর নাও হতে পারে। এবং কিছু ডিগ্রি বট ট্র্যাফিক চাওয়ার কারণ থাকতে পারে, যেমন বটগুলি যা অনুসন্ধান ইঞ্জিনগুলির জন্য সূচক সাইটগুলি।
গ্ল্যাম-ই ল্যাব জরিপটি এই মাসের শুরুর দিকে কনফেডারেশন অফ ওপেন অ্যাক্সেস রিপোজিটরিজ (সিওএআর) দ্বারা লাইব্রেরি, বিশ্ববিদ্যালয় এবং অন্যান্য প্রতিষ্ঠান দ্বারা পরিচালিত ওপেন অ্যাক্সেস রিপোজিটরিগুলির প্রতিক্রিয়াগুলির ভিত্তিতে জারি করা অনুরূপ প্রতিবেদনের অনুসন্ধানের প্রতিধ্বনি দেয়।
দ্য রিপোর্ট বলেছেন: “জরিপের 90 শতাংশেরও বেশি উত্তরদাতারা ইঙ্গিত করেছেন যে তাদের ভাণ্ডারগুলি আক্রমণাত্মক বটগুলির মুখোমুখি হচ্ছে, সাধারণত সপ্তাহে একাধিকবার এবং প্রায়শই মন্দা এবং পরিষেবা বিভ্রাটের দিকে পরিচালিত করে। যদিও এই বটগুলির উদ্দেশ্য সম্পর্কে 100 শতাংশ নির্দিষ্ট হওয়ার কোনও উপায় নেই, তবে সম্প্রদায়ের এই ধারণাটি হ’ল তারা এআই বটগুলি জেনারেটরি এআই প্রশিক্ষণের জন্য ডেটা সংগ্রহের জন্য।”
গ্ল্যাম-ই ল্যাব জরিপটি উইকিমিডিয়া ফাউন্ডেশন, সোর্সহুট, ডায়াস্পোরা বিকাশকারী দ্বারা উত্থাপিত আপত্তিজনক বট সম্পর্কে অভিযোগের কথাও স্মরণ করে ডেনিস শুবার্টমেরামত সাইট ifixit, এবং ডকুমেন্টেশন প্রকল্প রিডথডোকস।
শেষ পর্যন্ত, গ্ল্যাম-ই প্রতিবেদনে যুক্তি দেওয়া হয়েছে যে এআই সরবরাহকারীদের অন্যান্য ওয়েবসাইটগুলির সাথে যোগাযোগের জন্য আরও দায়িত্বশীল উপায়গুলি বিকাশ করা দরকার।
প্রতিবেদনে বলা হয়েছে, “যে সাংস্কৃতিক প্রতিষ্ঠানগুলি অনলাইন সংগ্রহগুলি হোস্ট করে তাদের আরও সার্ভার যুক্ত করা, আরও পরিশীলিত ফায়ারওয়াল মোতায়েন করা এবং চিরস্থায়ীভাবে আরও অপারেশন ইঞ্জিনিয়ারদের নিয়োগের জন্য পুনরুত্থিত করা হয় না,” প্রতিবেদনে বলা হয়েছে। “এর অর্থ এটি যে ডেটাগুলির জন্য ক্ষুধার্ত রয়েছে সেগুলি অ্যাক্সেস করার জন্য একটি টেকসই উপায় খুঁজে পেতে এটি বট দিয়ে তাদের ঝাঁকুনির দীর্ঘমেয়াদী আগ্রহের মধ্যে রয়েছে।” ®