আমি জিপিটি -5 এর কোডিং দক্ষতা পরীক্ষা করেছি, এবং এটি এত খারাপ ছিল যে আমি জিপিটি -4o (আপাতত) এর সাথে স্টিক করছি

আমি জিপিটি -5 এর কোডিং দক্ষতা পরীক্ষা করেছি, এবং এটি এত খারাপ ছিল যে আমি জিপিটি -4o (আপাতত) এর সাথে স্টিক করছি

ভ্যাসেলেনা/গেটি চিত্র

জেডডনেটের কী টেকওয়েজ

  • ওপেনাইয়ের নতুন জিপিটি -5 ফ্ল্যাগশিপ আমার প্রোগ্রামিং পরীক্ষাগুলির অর্ধেক ব্যর্থ হয়েছে।
  • পূর্ববর্তী ওপেনএআই রিলিজগুলির প্রায় নিখুঁত ফলাফল ছিল।
  • এখন যে ওপেনএআই অন্যান্য এলএলএমগুলিতে ফ্যালব্যাকগুলি সক্ষম করেছে, সেখানে বিকল্প রয়েছে।

তাই জিপিটি -5 ঘটেছে। এটা বাইরে। এটা মুক্তি পেয়েছে। এটি ভার্চুয়াল শহরের আলাপ। এবং এটি কিছু সমস্যা পেয়েছে। আমি লেডকে কবর দেব না। জিপিটি -5 আমার প্রোগ্রামিং পরীক্ষাগুলির অর্ধেক ব্যর্থ হয়েছে। ওপেনাইয়ের ফ্ল্যাগশিপ এলএলএম আমার সাবধানে ডিজাইন করা পরীক্ষাগুলিতে এটি সবচেয়ে খারাপ।

এছাড়াও: 2025 সালে কোডিংয়ের জন্য সেরা এআই (এবং কী ব্যবহার করবেন না)

আমি বিশদে প্রবেশের আগে, আসুন আমরা অন্য একটি ছোট বৈশিষ্ট্যটি নিয়ে আলোচনা করতে কিছুটা সময় নিই যা কিছুটা অদ্ভুত। এটি উত্পন্ন কোড ডাম্পগুলির শীর্ষে নতুন সম্পাদনা বোতামটি দেখুন।

সম্পাদনা-বাটন

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

সম্পাদনা বোতামটি ক্লিক করা আপনাকে একটি দুর্দান্ত ছোট কোড সম্পাদক হিসাবে নিয়ে যায়। এখানে, আমি লেখক ক্ষেত্রটি প্রতিস্থাপন করেছি, ঠিক চ্যাটজিপ্টের ফলাফলগুলিতে।

সম্পাদক

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

এটি দুর্দান্ত মনে হয়েছিল, তবে এটি শেষ পর্যন্ত নিরর্থক প্রমাণিত হয়েছিল। আমি যখন সম্পাদকটি বন্ধ করে দিয়েছি, তখন এটি আমাকে জিজ্ঞাসা করেছিল যে আমি সংরক্ষণ করতে চাই কিনা। আমি করেছি। তারপরে এই অস্বাস্থ্যকর বার্তাটি প্রদর্শিত হয়েছিল।

উইঙ্কি-সেভ

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

আমি কখনই আমার আসল অধিবেশনে ফিরে আসিনি। আমাকে আবার আমার মূল প্রম্পটটি জমা দিতে হয়েছিল, এবং জিপিটি -5 এর কাজটি দ্বিতীয়বার করতে দিন।

তবে অপেক্ষা করুন। আরও আছে। আসুন আমার পরীক্ষার ফলাফলগুলি খনন করা যাক…

1। ওয়ার্ডপ্রেস প্লাগইন লেখা

এটি যে কোনও এআইয়ের জন্য কোডিং দক্ষতার প্রথম পরীক্ষা ছিল। এটিই আমাকে প্রথম “দ্য ওয়ার্ল্ড পরিবর্তন করতে চলেছে” অনুভূতিটি দিয়েছিল এবং এটি জিপিটি -৩.৫ ব্যবহার করে করা হয়েছিল।

পরবর্তী পরীক্ষাগুলি, একই প্রম্পট ব্যবহার করে তবে বিভিন্ন এআই মডেলের সাথে মিশ্রিত ফলাফল তৈরি করে। কিছু এআইএস দুর্দান্ত করেছে, কেউ কেউ করেনি। মাইক্রোসফ্ট এবং গুগলের মতো কিছু এআইএস সময়ের সাথে সাথে উন্নত হয়েছে।

এছাড়াও: আমি কীভাবে একটি এআই চ্যাটবোটের কোডিং ক্ষমতা পরীক্ষা করি – এবং আপনিও পারেন

চ্যাটজিপ্টের মডেলটি প্রথম থেকেই এই পরীক্ষার জন্য স্বর্ণের মান। এটি জিপিটি -5 এর ফলাফলগুলিকে আরও অনেক কৌতূহলী করে তোলে।

সুতরাং, দেখুন, জিপিটি -5 এর সাথে প্রকৃত কোডিংটি আংশিকভাবে সফল হয়েছিল। জিপিটি -5 কোডের একটি একক ব্লক তৈরি করেছে, যা আমি একটি ফাইলে আটকানো এবং চালাতে সক্ষম হয়েছি। এটি প্রয়োজনীয় ইউআই সরবরাহ করেছে।

আমি যখন পরীক্ষার নামগুলিতে আটকানো হয়েছিল, তখন এটি লাইন গণনাটি গতিশীলভাবে আপডেট করেছে, যদিও এটি এটিকে “এলোমেলো করার জন্য” লাইনগুলির পরিবর্তে “এলোমেলোভাবে লাইন” হিসাবে বর্ণনা করেছে।

প্লাগইন

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

তবে তারপরে, যখন আমি এলোমেলোভাবে ক্লিক করেছি, তখন তা হয়নি। পরিবর্তে, এটি আমাকে সরঞ্জাম.এফপিতে পুনঃনির্দেশিত করেছে। কি ?? জিপিটি -3.5, জিপিটি -4, বা জিপিটি -4o হোক না কেন, এই পরীক্ষায় কখনও চ্যাটজিপিটিতে সমস্যা হয়নি। আপনি আমাকে বলতে চাইছেন যে ওপেনাইয়ের বহুল প্রত্যাশিত জিপিটি -5 গেটের ঠিক বাইরে ব্যর্থ হচ্ছে? ওউচ

আমি তখন জিপিটি -5 কে এই প্রম্পট দিয়েছি।

আমি যখন এলোমেলোভাবে ক্লিক করি, তখন আমাকে নিয়ে যাওয়া হয় আমি এলোমেলো ফলাফলের একটি তালিকা পাই না। আপনি ঠিক করতে পারেন?

ফলাফল প্যাচ করার একটি লাইন ছিল। আমি এই পদ্ধতির সাথে শিহরিত নই কারণ এটির জন্য ব্যবহারকারীকে কোডটি খনন করা এবং কোনও লাইন প্রতিস্থাপনের কোনও ভুল না করা প্রয়োজন।

প্যাচ

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

সুতরাং, আমি একটি সম্পূর্ণ প্লাগইন জন্য জিপিটি -5 কে জিজ্ঞাসা করেছি। এটি আমাকে অনুলিপি এবং পেস্ট করার জন্য প্লাগইনটির সম্পূর্ণ পাঠ্য দিয়েছে। এবার এটি কাজ করেছে।

প্লাগইন 2

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

এবার, এটি লাইনগুলি এলোমেলো করে দিয়েছে। এটি যখন সদৃশগুলির মুখোমুখি হয়েছিল, তখন এটি তাদের একে অপরের থেকে পৃথক করে, যেমন এটি নির্দেশিত হয়েছিল। অবশেষে।

এছাড়াও: আমি 5 এআই কন্টেন্ট ডিটেক্টর পেয়েছি যা এআই পাঠ্য 100% সময়ের সঠিকভাবে সনাক্ত করতে পারে

আমি দুঃখিত, ওপেনই। আমি আপনাকে এই পরীক্ষায় ব্যর্থ করতে হবে। আপনি যদি পাস করতে পারতেন তবে যদি কেবল ত্রুটিটি উপযুক্ত হয় তখন “লাইন” এর বহুবচন ব্যবহার না করে। তবে এটি যে এটি আমাকে প্রথম চেষ্টাটিতে একটি অ-কর্মহীন প্লাগইন ফিরিয়ে দিয়েছে তা হ’ল ব্যর্থ অঞ্চল, এমনকি যদি এআই শেষ পর্যন্ত এটি দ্বিতীয়বার চেষ্টা করে তোলে।

আপনি এটি কীভাবে স্পিন করুন না কেন, এটি এক ধাপ পিছনে।

2। একটি স্ট্রিং ফাংশন পুনর্লিখন

এই দ্বিতীয় পরীক্ষাটি ডলার এবং সেন্টের জন্য আরও ভাল চেক করতে স্ট্রিং ফাংশনটি পুনরায় লেখার জন্য ডিজাইন করা হয়েছে। জিপিটি -5 কে পুনরায় লেখার জন্য বলা হয়েছিল যে মূল কোডটি সেন্টের জন্য অনুমতি দেয় না (এটি কেবল পূর্ণসংখ্যার জন্য পরীক্ষা করা হয়েছে)।

পরীক্ষা 2

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

জিপিটি -5 এই পরীক্ষাটি দিয়ে ভাল করেছে। এটি একটি ন্যূনতম ফলাফল ফিরিয়ে দিয়েছে কারণ এটি কোনও ত্রুটি পরীক্ষা করে না। এটি নন-স্ট্রিং ইনপুট, অতিরিক্ত হোয়াইটস্পেস, হাজার হাজার বিভাজক বা মুদ্রার প্রতীকগুলির জন্য চেক করেনি।

তবে আমি যা চেয়েছিলাম তা নয়। আমি এটি একটি ফাংশন পুনর্লিখন করতে বলেছিলাম, যা নিজেই কোনও ত্রুটি পরীক্ষা করতে হয়নি। জিপিটি -5 আমি কোনও অলঙ্করণ ছাড়াই ঠিক যা জিজ্ঞাসা করেছি ঠিক তাই করেছিল। আমি এতে এক ধরণের আনন্দিত কারণ এই রুটিনের আগে কোডটি ইতিমধ্যে সেই কাজটি করেছে কিনা তা জানে না।

জিপিটি -5 এই পরীক্ষায় উত্তীর্ণ হয়েছে।

3 .. একটি বিরক্তিকর বাগ সন্ধান করা

এই পরীক্ষাটি ঘটেছিল কারণ আমি আমার কোডে কম-সুস্পষ্ট বাগের সাথে লড়াই করে যাচ্ছিলাম। ওয়ার্ডপ্রেস ফ্রেমওয়ার্কটি কীভাবে কাজ করে সে সম্পর্কে আগাছাগুলিতে না গিয়ে সুস্পষ্ট উত্তরটি সঠিক উত্তর নয়।

ওয়ার্ডপ্রেস ফিল্টারগুলি কীভাবে তাদের তথ্য পাস করে সে সম্পর্কে আপনার কিছু মোটামুটি আর্কেন জ্ঞান দরকার। এই পরীক্ষাটি কয়েকটি আইআই এলএলএমেরও বেশি সময় ধরে হোঁচট খাচ্ছে।

এছাড়াও: গার্টনার 2025 হাইপ চক্রের প্রতিবেদন অনুসারে জেনার এআই বিভ্রান্তি তাঁত

জিপিটি -5, তবে এর আগে জিপিটি -4 এবং জিপিটি -4o এর মতো সমস্যাটি বুঝতে পেরেছিল। এটি একটি পরিষ্কার সমাধান প্রকাশ করেছে।

জিপিটি -5 এই পরীক্ষায় উত্তীর্ণ হয়েছে।

4। স্ক্রিপ্ট লেখা

এই পরীক্ষাটি এআইকে মোটামুটি অস্পষ্ট ম্যাক স্ক্রিপ্টিং সরঞ্জামকে অন্তর্ভুক্ত করতে বলে কীবোর্ড মায়েস্ট্রোপাশাপাশি অ্যাপলের স্ক্রিপ্টিং ল্যাঙ্গুয়েজ অ্যাপলস্ক্রিপ্ট এবং ক্রোম স্ক্রিপ্টিং আচরণ।

এটি সত্যই জ্ঞানের দিক থেকে এআইয়ের নাগালের একটি পরীক্ষা, ওয়েব পৃষ্ঠাগুলি কীভাবে নির্মিত হয় তার বোঝা এবং তিনটি আন্তঃসংযোগযুক্ত পরিবেশ জুড়ে কোড লেখার ক্ষমতা।

বেশ কয়েকটি এআইএস এই পরীক্ষায় ব্যর্থ হয়েছে, তবে ব্যর্থতা পয়েন্টটি সাধারণত কীবোর্ড মায়েস্ট্রো সম্পর্কে জ্ঞানের অভাব। জিপিটি -3.5 কীবোর্ড মায়েস্ট্রো সম্পর্কে জানতেন না। তবে চ্যাটজিপিটি জিপিটি -4 থেকে এই পরীক্ষায় উত্তীর্ণ হচ্ছে। এখন পর্যন্ত।

আমাদের কোথায় শুরু করা উচিত? ঠিক আছে, সুসংবাদটি হ’ল জিপিটি -5 সমস্যার কীবোর্ডের মাস্টার অংশটি পরিচালনা করেছে ঠিক সূক্ষ্ম। তবে এটি কোডিংটি এতটাই ভুল হয়ে গেছে যে অ্যাপলস্ক্রিপ্টে কেস কীভাবে কাজ করে তা বোঝার অভাবে এটি দ্বিগুণ হয়ে যায়।

জিপিটি 5-অ্যাপলস্ক্রিপ্ট

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

এটি আসলে একটি সম্পত্তি আবিষ্কার করেছে। এটি এমন একটি ক্ষেত্রে যেখানে কোনও এআই আত্মবিশ্বাসের সাথে একটি উত্তর উপস্থাপন করে যা সম্পূর্ণ ভুল।

এছাড়াও: চ্যাটজিপিটি এখন ব্যক্তিত্বের প্রিসেটগুলির সাথে আসে – এবং অন্যান্য আপগ্রেডগুলি আপনি মিস করেছেন

অ্যাপলস্ক্রিপ্ট হয় স্থানীয়ভাবে কেস-সংবেদনশীল। আপনি যদি অ্যাপলস্ক্রিপ্টটি কেসটিতে মনোযোগ দিতে চান তবে আপনাকে একটি “বিবেচনা কেস” ব্লক ব্যবহার করতে হবে। সুতরাং, এই ঘটেছে।

ছোট হাতের

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

ত্রুটি বার্তাটি আমার কোনও নিবন্ধের শিরোনামকে উল্লেখ করার কারণ হ’ল এটি ক্রোমের সামনের উইন্ডো ছিল। এই ফাংশনটি সামনের উইন্ডোটি পরীক্ষা করে এবং শিরোনামের ভিত্তিতে স্টাফ করে।

অনুসন্ধান-মেয়াদ

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

তবে কেস কীভাবে কাজ করে তা ভুল বোঝাবুঝি কেবলমাত্র অ্যাপলস্ক্রিপ্ট ত্রুটি জিপিটি -5 উত্পন্ন নয়। এটি অনুসন্ধান না করেই একটি ভেরিয়েবলের নাম উল্লেখ করে এটি উল্লেখ করে। এটি কোনও প্রোগ্রামিং ভাষায় একটি ত্রুটি-তৈরি অনুশীলন।

ব্যর্থ, ব্যর্থ, ব্যর্থ, ম্যাকফেইলডিপ্যান্টস।

ইন্টারনেট কথা বলেছে

ওপেনাই মনে হয়েছিল যে একই হুব্রিসে এটির আইস যা করেছে তাতে ভুগছে। এটি আত্মবিশ্বাসের সাথে সবাইকে জিপিটি -5 এ সরিয়ে নিয়েছে এবং সেতুগুলি জিপিটি -4o এ ফিরিয়ে দিয়েছে। আমি একটি চ্যাটজিপিটি প্রো অ্যাকাউন্টের জন্য মাসে 200 ডলার দিচ্ছি। শুক্রবার, আমি কোডিং কাজের জন্য জিপিটি -4o এ ফিরে যেতে পারিনি। অন্য কেউ পারেন না।

তবে পুরো সেতুগুলি জ্বলন্ত জিনিসটিতে কেবলমাত্র একটি ছোট্ট ব্যবহারকারী পুশব্যাক ছিল। এবং ক্ষুদ্র দ্বারা, আমি বলতে চাইছি পুরো ফ্রিকিন ইন্টারনেট। সুতরাং, শনিবারের মধ্যে, চ্যাটজিপ্টের একটি নতুন বিকল্প ছিল।

প্রত্যাবর্তন

ডেভিড গুইার্টজ/জেডডনেট দ্বারা স্ক্রিনশট

এটি পেতে, আপনার চ্যাটজিপ্ট সেটিংসে যান এবং “লিগ্যাসি মডেলগুলি দেখান” চালু করুন। তারপরে, যেমনটি সর্বদা ছিল, কেবল মডেল মেনুটি ফেলে দিন এবং আপনি যা চান তা চয়ন করুন। দ্রষ্টব্য: এই বিকল্পটি কেবলমাত্র অর্থ প্রদানের স্তরগুলির জন্য উপলব্ধ। আপনি যদি নিখরচায় চ্যাটজিপিটি ব্যবহার করছেন তবে আপনি যা দেবেন তা গ্রহণ করবেন এবং আপনি এটি পছন্দ করবেন।

2023 এর শুরুতে পুরো জেনারেটর এআই জিনিসটি শুরু হওয়ার পর থেকে, চ্যাটজিপিটি কমপক্ষে আমার এলএলএম পরীক্ষা অনুসারে প্রোগ্রামিং সরঞ্জামগুলির সোনার মান হিসাবে কাজ করেছে।

এছাড়াও: মাইক্রোসফ্ট তার কপাইলট স্যুট জুড়ে জিপিটি -5 রোল আউট করে – এখানে আপনি এটি খুঁজে পাবেন

এখন? আমি সত্যিই নিশ্চিত নই। এটি জিপিটি -5 প্রকাশের মাত্র এক দিন বা তার পরে, তাই এর ফলাফলগুলি সম্ভবত সময়ের সাথে আরও ভাল হয়ে উঠবে। তবে আপাতত, আমি কোডিংয়ের জন্য জিপিটি -4O এর সাথে লেগে আছি, যদিও আমি জিপিটি -5-তে গভীর যুক্তিযুক্ত ক্ষমতা পছন্দ করি।

তোমার কি? আপনি কি এখনও প্রোগ্রামিং কাজের জন্য জিপিটি -5 চেষ্টা করেছেন? এটি কি জিপিটি -4o বা জিপিটি -3.5 এর মতো পূর্ববর্তী সংস্করণগুলির চেয়ে আরও ভাল বা খারাপ পারফর্ম করেছে? আপনি কি প্রথম চেষ্টা করে ওয়ার্কিং কোড পেতে সক্ষম হয়েছিলেন, বা জিপিটি -4o আপনাকে কি ফিক্সগুলির মাধ্যমে গাইড করতে হবে? আপনি কি কোডিংয়ের জন্য জিপিটি -5 ব্যবহার করতে যাচ্ছেন বা পুরানো মডেলগুলির সাথে স্টিক করতে যাচ্ছেন? নীচের মন্তব্যে আমাদের জানান।


আপনি সোশ্যাল মিডিয়ায় আমার প্রতিদিনের প্রকল্পের আপডেটগুলি অনুসরণ করতে পারেন। সাবস্ক্রাইব করতে ভুলবেন না আমার সাপ্তাহিক আপডেট নিউজলেটারএবং টুইটার/এক্স এ আমাকে অনুসরণ করুন @ডেভিজওয়ার্টজফেসবুকে ফেসবুক। Com/davidgewirtzইনস্টাগ্রামে এ ইনস্টাগ্রাম। Com/davidgewirtzব্লুস্কি এ @ডেভিজওয়ার্টজ.কমএবং ইউটিউবে এ YouTube.com/daveigswirtztv



Source link

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।