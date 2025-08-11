জেডডনেটের কী টেকওয়েজ
- ওপেনাইয়ের নতুন জিপিটি -5 ফ্ল্যাগশিপ আমার প্রোগ্রামিং পরীক্ষাগুলির অর্ধেক ব্যর্থ হয়েছে।
- পূর্ববর্তী ওপেনএআই রিলিজগুলির প্রায় নিখুঁত ফলাফল ছিল।
- এখন যে ওপেনএআই অন্যান্য এলএলএমগুলিতে ফ্যালব্যাকগুলি সক্ষম করেছে, সেখানে বিকল্প রয়েছে।
তাই জিপিটি -5 ঘটেছে। এটা বাইরে। এটা মুক্তি পেয়েছে। এটি ভার্চুয়াল শহরের আলাপ। এবং এটি কিছু সমস্যা পেয়েছে। আমি লেডকে কবর দেব না। জিপিটি -5 আমার প্রোগ্রামিং পরীক্ষাগুলির অর্ধেক ব্যর্থ হয়েছে। ওপেনাইয়ের ফ্ল্যাগশিপ এলএলএম আমার সাবধানে ডিজাইন করা পরীক্ষাগুলিতে এটি সবচেয়ে খারাপ।
আমি বিশদে প্রবেশের আগে, আসুন আমরা অন্য একটি ছোট বৈশিষ্ট্যটি নিয়ে আলোচনা করতে কিছুটা সময় নিই যা কিছুটা অদ্ভুত। এটি উত্পন্ন কোড ডাম্পগুলির শীর্ষে নতুন সম্পাদনা বোতামটি দেখুন।
সম্পাদনা বোতামটি ক্লিক করা আপনাকে একটি দুর্দান্ত ছোট কোড সম্পাদক হিসাবে নিয়ে যায়। এখানে, আমি লেখক ক্ষেত্রটি প্রতিস্থাপন করেছি, ঠিক চ্যাটজিপ্টের ফলাফলগুলিতে।
এটি দুর্দান্ত মনে হয়েছিল, তবে এটি শেষ পর্যন্ত নিরর্থক প্রমাণিত হয়েছিল। আমি যখন সম্পাদকটি বন্ধ করে দিয়েছি, তখন এটি আমাকে জিজ্ঞাসা করেছিল যে আমি সংরক্ষণ করতে চাই কিনা। আমি করেছি। তারপরে এই অস্বাস্থ্যকর বার্তাটি প্রদর্শিত হয়েছিল।
আমি কখনই আমার আসল অধিবেশনে ফিরে আসিনি। আমাকে আবার আমার মূল প্রম্পটটি জমা দিতে হয়েছিল, এবং জিপিটি -5 এর কাজটি দ্বিতীয়বার করতে দিন।
তবে অপেক্ষা করুন। আরও আছে। আসুন আমার পরীক্ষার ফলাফলগুলি খনন করা যাক…
1। ওয়ার্ডপ্রেস প্লাগইন লেখা
এটি যে কোনও এআইয়ের জন্য কোডিং দক্ষতার প্রথম পরীক্ষা ছিল। এটিই আমাকে প্রথম “দ্য ওয়ার্ল্ড পরিবর্তন করতে চলেছে” অনুভূতিটি দিয়েছিল এবং এটি জিপিটি -৩.৫ ব্যবহার করে করা হয়েছিল।
পরবর্তী পরীক্ষাগুলি, একই প্রম্পট ব্যবহার করে তবে বিভিন্ন এআই মডেলের সাথে মিশ্রিত ফলাফল তৈরি করে। কিছু এআইএস দুর্দান্ত করেছে, কেউ কেউ করেনি। মাইক্রোসফ্ট এবং গুগলের মতো কিছু এআইএস সময়ের সাথে সাথে উন্নত হয়েছে।
চ্যাটজিপ্টের মডেলটি প্রথম থেকেই এই পরীক্ষার জন্য স্বর্ণের মান। এটি জিপিটি -5 এর ফলাফলগুলিকে আরও অনেক কৌতূহলী করে তোলে।
সুতরাং, দেখুন, জিপিটি -5 এর সাথে প্রকৃত কোডিংটি আংশিকভাবে সফল হয়েছিল। জিপিটি -5 কোডের একটি একক ব্লক তৈরি করেছে, যা আমি একটি ফাইলে আটকানো এবং চালাতে সক্ষম হয়েছি। এটি প্রয়োজনীয় ইউআই সরবরাহ করেছে।
আমি যখন পরীক্ষার নামগুলিতে আটকানো হয়েছিল, তখন এটি লাইন গণনাটি গতিশীলভাবে আপডেট করেছে, যদিও এটি এটিকে “এলোমেলো করার জন্য” লাইনগুলির পরিবর্তে “এলোমেলোভাবে লাইন” হিসাবে বর্ণনা করেছে।
তবে তারপরে, যখন আমি এলোমেলোভাবে ক্লিক করেছি, তখন তা হয়নি। পরিবর্তে, এটি আমাকে সরঞ্জাম.এফপিতে পুনঃনির্দেশিত করেছে। কি ?? জিপিটি -3.5, জিপিটি -4, বা জিপিটি -4o হোক না কেন, এই পরীক্ষায় কখনও চ্যাটজিপিটিতে সমস্যা হয়নি। আপনি আমাকে বলতে চাইছেন যে ওপেনাইয়ের বহুল প্রত্যাশিত জিপিটি -5 গেটের ঠিক বাইরে ব্যর্থ হচ্ছে? ওউচ
আমি তখন জিপিটি -5 কে এই প্রম্পট দিয়েছি।
আমি যখন এলোমেলোভাবে ক্লিক করি, তখন আমাকে নিয়ে যাওয়া হয় আমি এলোমেলো ফলাফলের একটি তালিকা পাই না। আপনি ঠিক করতে পারেন?
ফলাফল প্যাচ করার একটি লাইন ছিল। আমি এই পদ্ধতির সাথে শিহরিত নই কারণ এটির জন্য ব্যবহারকারীকে কোডটি খনন করা এবং কোনও লাইন প্রতিস্থাপনের কোনও ভুল না করা প্রয়োজন।
সুতরাং, আমি একটি সম্পূর্ণ প্লাগইন জন্য জিপিটি -5 কে জিজ্ঞাসা করেছি। এটি আমাকে অনুলিপি এবং পেস্ট করার জন্য প্লাগইনটির সম্পূর্ণ পাঠ্য দিয়েছে। এবার এটি কাজ করেছে।
এবার, এটি লাইনগুলি এলোমেলো করে দিয়েছে। এটি যখন সদৃশগুলির মুখোমুখি হয়েছিল, তখন এটি তাদের একে অপরের থেকে পৃথক করে, যেমন এটি নির্দেশিত হয়েছিল। অবশেষে।
আমি দুঃখিত, ওপেনই। আমি আপনাকে এই পরীক্ষায় ব্যর্থ করতে হবে। আপনি যদি পাস করতে পারতেন তবে যদি কেবল ত্রুটিটি উপযুক্ত হয় তখন “লাইন” এর বহুবচন ব্যবহার না করে। তবে এটি যে এটি আমাকে প্রথম চেষ্টাটিতে একটি অ-কর্মহীন প্লাগইন ফিরিয়ে দিয়েছে তা হ’ল ব্যর্থ অঞ্চল, এমনকি যদি এআই শেষ পর্যন্ত এটি দ্বিতীয়বার চেষ্টা করে তোলে।
আপনি এটি কীভাবে স্পিন করুন না কেন, এটি এক ধাপ পিছনে।
2। একটি স্ট্রিং ফাংশন পুনর্লিখন
এই দ্বিতীয় পরীক্ষাটি ডলার এবং সেন্টের জন্য আরও ভাল চেক করতে স্ট্রিং ফাংশনটি পুনরায় লেখার জন্য ডিজাইন করা হয়েছে। জিপিটি -5 কে পুনরায় লেখার জন্য বলা হয়েছিল যে মূল কোডটি সেন্টের জন্য অনুমতি দেয় না (এটি কেবল পূর্ণসংখ্যার জন্য পরীক্ষা করা হয়েছে)।
জিপিটি -5 এই পরীক্ষাটি দিয়ে ভাল করেছে। এটি একটি ন্যূনতম ফলাফল ফিরিয়ে দিয়েছে কারণ এটি কোনও ত্রুটি পরীক্ষা করে না। এটি নন-স্ট্রিং ইনপুট, অতিরিক্ত হোয়াইটস্পেস, হাজার হাজার বিভাজক বা মুদ্রার প্রতীকগুলির জন্য চেক করেনি।
তবে আমি যা চেয়েছিলাম তা নয়। আমি এটি একটি ফাংশন পুনর্লিখন করতে বলেছিলাম, যা নিজেই কোনও ত্রুটি পরীক্ষা করতে হয়নি। জিপিটি -5 আমি কোনও অলঙ্করণ ছাড়াই ঠিক যা জিজ্ঞাসা করেছি ঠিক তাই করেছিল। আমি এতে এক ধরণের আনন্দিত কারণ এই রুটিনের আগে কোডটি ইতিমধ্যে সেই কাজটি করেছে কিনা তা জানে না।
জিপিটি -5 এই পরীক্ষায় উত্তীর্ণ হয়েছে।
3 .. একটি বিরক্তিকর বাগ সন্ধান করা
এই পরীক্ষাটি ঘটেছিল কারণ আমি আমার কোডে কম-সুস্পষ্ট বাগের সাথে লড়াই করে যাচ্ছিলাম। ওয়ার্ডপ্রেস ফ্রেমওয়ার্কটি কীভাবে কাজ করে সে সম্পর্কে আগাছাগুলিতে না গিয়ে সুস্পষ্ট উত্তরটি সঠিক উত্তর নয়।
ওয়ার্ডপ্রেস ফিল্টারগুলি কীভাবে তাদের তথ্য পাস করে সে সম্পর্কে আপনার কিছু মোটামুটি আর্কেন জ্ঞান দরকার। এই পরীক্ষাটি কয়েকটি আইআই এলএলএমেরও বেশি সময় ধরে হোঁচট খাচ্ছে।
জিপিটি -5, তবে এর আগে জিপিটি -4 এবং জিপিটি -4o এর মতো সমস্যাটি বুঝতে পেরেছিল। এটি একটি পরিষ্কার সমাধান প্রকাশ করেছে।
জিপিটি -5 এই পরীক্ষায় উত্তীর্ণ হয়েছে।
4। স্ক্রিপ্ট লেখা
এই পরীক্ষাটি এআইকে মোটামুটি অস্পষ্ট ম্যাক স্ক্রিপ্টিং সরঞ্জামকে অন্তর্ভুক্ত করতে বলে কীবোর্ড মায়েস্ট্রোপাশাপাশি অ্যাপলের স্ক্রিপ্টিং ল্যাঙ্গুয়েজ অ্যাপলস্ক্রিপ্ট এবং ক্রোম স্ক্রিপ্টিং আচরণ।
এটি সত্যই জ্ঞানের দিক থেকে এআইয়ের নাগালের একটি পরীক্ষা, ওয়েব পৃষ্ঠাগুলি কীভাবে নির্মিত হয় তার বোঝা এবং তিনটি আন্তঃসংযোগযুক্ত পরিবেশ জুড়ে কোড লেখার ক্ষমতা।
বেশ কয়েকটি এআইএস এই পরীক্ষায় ব্যর্থ হয়েছে, তবে ব্যর্থতা পয়েন্টটি সাধারণত কীবোর্ড মায়েস্ট্রো সম্পর্কে জ্ঞানের অভাব। জিপিটি -3.5 কীবোর্ড মায়েস্ট্রো সম্পর্কে জানতেন না। তবে চ্যাটজিপিটি জিপিটি -4 থেকে এই পরীক্ষায় উত্তীর্ণ হচ্ছে। এখন পর্যন্ত।
আমাদের কোথায় শুরু করা উচিত? ঠিক আছে, সুসংবাদটি হ’ল জিপিটি -5 সমস্যার কীবোর্ডের মাস্টার অংশটি পরিচালনা করেছে ঠিক সূক্ষ্ম। তবে এটি কোডিংটি এতটাই ভুল হয়ে গেছে যে অ্যাপলস্ক্রিপ্টে কেস কীভাবে কাজ করে তা বোঝার অভাবে এটি দ্বিগুণ হয়ে যায়।
এটি আসলে একটি সম্পত্তি আবিষ্কার করেছে। এটি এমন একটি ক্ষেত্রে যেখানে কোনও এআই আত্মবিশ্বাসের সাথে একটি উত্তর উপস্থাপন করে যা সম্পূর্ণ ভুল।
অ্যাপলস্ক্রিপ্ট হয় স্থানীয়ভাবে কেস-সংবেদনশীল। আপনি যদি অ্যাপলস্ক্রিপ্টটি কেসটিতে মনোযোগ দিতে চান তবে আপনাকে একটি “বিবেচনা কেস” ব্লক ব্যবহার করতে হবে। সুতরাং, এই ঘটেছে।
ত্রুটি বার্তাটি আমার কোনও নিবন্ধের শিরোনামকে উল্লেখ করার কারণ হ’ল এটি ক্রোমের সামনের উইন্ডো ছিল। এই ফাংশনটি সামনের উইন্ডোটি পরীক্ষা করে এবং শিরোনামের ভিত্তিতে স্টাফ করে।
তবে কেস কীভাবে কাজ করে তা ভুল বোঝাবুঝি কেবলমাত্র অ্যাপলস্ক্রিপ্ট ত্রুটি জিপিটি -5 উত্পন্ন নয়। এটি অনুসন্ধান না করেই একটি ভেরিয়েবলের নাম উল্লেখ করে এটি উল্লেখ করে। এটি কোনও প্রোগ্রামিং ভাষায় একটি ত্রুটি-তৈরি অনুশীলন।
ব্যর্থ, ব্যর্থ, ব্যর্থ, ম্যাকফেইলডিপ্যান্টস।
ইন্টারনেট কথা বলেছে
ওপেনাই মনে হয়েছিল যে একই হুব্রিসে এটির আইস যা করেছে তাতে ভুগছে। এটি আত্মবিশ্বাসের সাথে সবাইকে জিপিটি -5 এ সরিয়ে নিয়েছে এবং সেতুগুলি জিপিটি -4o এ ফিরিয়ে দিয়েছে। আমি একটি চ্যাটজিপিটি প্রো অ্যাকাউন্টের জন্য মাসে 200 ডলার দিচ্ছি। শুক্রবার, আমি কোডিং কাজের জন্য জিপিটি -4o এ ফিরে যেতে পারিনি। অন্য কেউ পারেন না।
তবে পুরো সেতুগুলি জ্বলন্ত জিনিসটিতে কেবলমাত্র একটি ছোট্ট ব্যবহারকারী পুশব্যাক ছিল। এবং ক্ষুদ্র দ্বারা, আমি বলতে চাইছি পুরো ফ্রিকিন ইন্টারনেট। সুতরাং, শনিবারের মধ্যে, চ্যাটজিপ্টের একটি নতুন বিকল্প ছিল।
এটি পেতে, আপনার চ্যাটজিপ্ট সেটিংসে যান এবং “লিগ্যাসি মডেলগুলি দেখান” চালু করুন। তারপরে, যেমনটি সর্বদা ছিল, কেবল মডেল মেনুটি ফেলে দিন এবং আপনি যা চান তা চয়ন করুন। দ্রষ্টব্য: এই বিকল্পটি কেবলমাত্র অর্থ প্রদানের স্তরগুলির জন্য উপলব্ধ। আপনি যদি নিখরচায় চ্যাটজিপিটি ব্যবহার করছেন তবে আপনি যা দেবেন তা গ্রহণ করবেন এবং আপনি এটি পছন্দ করবেন।
2023 এর শুরুতে পুরো জেনারেটর এআই জিনিসটি শুরু হওয়ার পর থেকে, চ্যাটজিপিটি কমপক্ষে আমার এলএলএম পরীক্ষা অনুসারে প্রোগ্রামিং সরঞ্জামগুলির সোনার মান হিসাবে কাজ করেছে।
এখন? আমি সত্যিই নিশ্চিত নই। এটি জিপিটি -5 প্রকাশের মাত্র এক দিন বা তার পরে, তাই এর ফলাফলগুলি সম্ভবত সময়ের সাথে আরও ভাল হয়ে উঠবে। তবে আপাতত, আমি কোডিংয়ের জন্য জিপিটি -4O এর সাথে লেগে আছি, যদিও আমি জিপিটি -5-তে গভীর যুক্তিযুক্ত ক্ষমতা পছন্দ করি।
তোমার কি? আপনি কি এখনও প্রোগ্রামিং কাজের জন্য জিপিটি -5 চেষ্টা করেছেন? এটি কি জিপিটি -4o বা জিপিটি -3.5 এর মতো পূর্ববর্তী সংস্করণগুলির চেয়ে আরও ভাল বা খারাপ পারফর্ম করেছে? আপনি কি প্রথম চেষ্টা করে ওয়ার্কিং কোড পেতে সক্ষম হয়েছিলেন, বা জিপিটি -4o আপনাকে কি ফিক্সগুলির মাধ্যমে গাইড করতে হবে? আপনি কি কোডিংয়ের জন্য জিপিটি -5 ব্যবহার করতে যাচ্ছেন বা পুরানো মডেলগুলির সাথে স্টিক করতে যাচ্ছেন? নীচের মন্তব্যে আমাদের জানান।
