রাডারে, পারফরম্যান্স একটি বৈশিষ্ট্য। আমাদের প্ল্যাটফর্ম বিশ্বব্যাপী কয়েক মিলিয়ন ডিভাইস থেকে প্রতিদিন 1 বিলিয়ন এপিআই কল প্রক্রিয়া করে। আমরা জিওলোকেশন অবকাঠামো এবং সমাধানগুলি সরবরাহ করি, এর জন্য এপিআই সহ:
- জিওকোডিং: ফরোয়ার্ড জিওকোডিং, বিপরীত জিওকোডিং এবং আইপি জিওকোডিং এপিআই বিশ্বব্যাপী কভারেজ সহ।
- অনুসন্ধান:: ঠিকানা স্বতঃপূর্ব, ঠিকানা বৈধতা এবং স্থান অনুসন্ধান এপিআই।
- রাউটিং:: দূরত্ব, ম্যাট্রিক্স, রুট অপ্টিমাইজেশন, রুট ম্যাচিং এবং দিকনির্দেশ এপিআই।
- জিওলোকেশন সম্মতি: বর্তমান এখতিয়ার, সীমান্তের দূরত্ব, নিয়ন্ত্রক বর্জন অঞ্চল এবং আরও অনেক কিছু সনাক্ত করুন।
তবে আমাদের পণ্য এবং ডেটা স্কেল হিসাবে, আমাদের ইঞ্জিনিয়ারিং চ্যালেঞ্জগুলিও তাই করে।
এই বৃদ্ধিকে সমর্থন করার জন্য, আমরা বিকাশ করেছি হরিজন্ডবমরিচায় রচিত একটি জিওপ্যাটিয়াল ডাটাবেস যা একাধিক অবস্থান পরিষেবাগুলিকে একক, অত্যন্ত পারফরম্যান্ট বাইনারিগুলিতে একীভূত করে। হরিজনডব সহ, আমরা উপরোক্ত সমস্ত ব্যবহারের ক্ষেত্রে দুর্দান্ত অপারেশনাল পদচিহ্ন সহ শক্তি দিতে সক্ষম হয়েছি:
- প্রতি কোর 1000 কিউপিএস হ্যান্ডেল করুন।
- 50ms এর একটি ফরোয়ার্ড জিওকোডিং মিডিয়ান লেটেন্সি বজায় রাখুন।
- <1ms এর একটি বিপরীত জিওকোডিং মিডিয়ান লেটেন্সি বজায় রাখুন।
- পণ্য হার্ডওয়্যারে রৈখিকভাবে স্কেল করুন।
কেন আমরা মঙ্গো এবং ইলাস্টিক অনুসন্ধান প্রতিস্থাপন করেছি
হরিজনডবির আগে, আমরা ফরোয়ার্ড জিওকোডিংয়ের জন্য ইলাস্টিকসার্ক এবং মাইক্রোসার্ভেসিস এবং বিপরীতে মঙ্গোডিবি জুড়ে জিওকোডিং বিভক্ত করি।
এই স্ট্যাকটি অপারেটিং এবং স্কেলিং ব্যয়বহুল ছিল: ইলাস্টিকসার্চ প্রায়শই সমস্ত শারড এবং প্রয়োজনীয় পরিষেবা-অর্কেস্ট্রেটেড ব্যাচের আপডেটগুলিতে প্রশ্নগুলি ফ্যান করা হয়, অন্যদিকে মঙ্গোডবিতে সত্যিকারের ব্যাচের ইনজেশন অভাবের অভাব ছিল, ওভারপ্রোভিশনিং প্রয়োজন, এবং খারাপ ডেটার জন্য কোনও নির্ভরযোগ্য বাল্ক রোলব্যাক ছিল না।
আর্কিটেকচার
এই পরিষেবার জন্য আমাদের লক্ষ্যগুলি অন্তর্ভুক্ত:
- দক্ষতা: পরিষেবাটি পণ্য মেশিনে চলতে পারে, অনুমানযোগ্য অটোস্কেলিং রয়েছে এবং এটি আমাদের সমস্ত জিও সত্তার সত্যের একক উত্স।
- অপারেশন: ডেটা সম্পদগুলি দিনে একাধিকবার তৈরি এবং প্রক্রিয়াজাত করা যায়, পরিবর্তনগুলি মোতায়েন করা যায় এবং তুচ্ছভাবে পিছনে ঘূর্ণিত করা যায় এবং এটি পরিচালনা করা সহজ হওয়া উচিত।
- বিকাশকারী অভিজ্ঞতা: বিকাশকারীদের স্থানীয়ভাবে পরিষেবাটি চালাতে সক্ষম হওয়া উচিত এবং পরিবর্তনগুলি সহজেই লেখা এবং পরীক্ষা করা যায়।
এই লক্ষ্যগুলি মাথায় রেখে আমরা হরিজন্ডব ব্যবহার করে তৈরি করেছি রকসডিবি, এস 2, ট্যান্টিভ, Fsts, লাইটজিবিএম এবং আমি।
ডেটা সম্পদগুলি ব্যবহার করে প্রিপ্রোসেসড হয় অ্যাপাচি স্পার্কমরিচাগুলিতে ইনজেস্টেড এবং এডাব্লুএস এস 3 তে সংস্করণযুক্ত সম্পদ হিসাবে সঞ্চিত।
মরিচা
https://www.rust-lang.org/
মোজিলা দ্বারা ডিজাইন করা একটি সংকলিত ভাষা সিস্টেম প্রোগ্রামিংয়ের জন্য। দলটি মরিচা সম্পর্কে পছন্দ করেছে এমন অনেক দিক রয়েছে:
- আবর্জনা সংগ্রহ ছাড়াই সংকলিত এবং মেমরি সুরক্ষা: রাস্টের স্ট্রং টাইপ সিস্টেম এবং রেয়ন এবং টোকিও আকারে নিরাপদ এবং অভিব্যক্তিপূর্ণ সম্মতি আমাদের পাঠযোগ্যতার ত্যাগ ছাড়াই পারফরম্যান্ট কোড লিখতে দেয়। মরিচা এটিকে আবর্জনা সংগ্রহ ছাড়াই মেমরি পরিচালনা করতে তুচ্ছ করে তোলে, আমাদের অনুমানযোগ্য বিলম্বের সাথে মেমরিতে ডেটাগুলির বৃহত সূচকগুলি পরিচালনা করতে দেয়।
- উচ্চতর অর্ডার বিমূর্তি: আমাদের অনেক প্রকৌশলী উচ্চ-স্তরের ভাষার সাথে কাজ করেন যেখানে অভিব্যক্তিপূর্ণ তালিকা অপারেশন, নাল-হ্যান্ডলিং এবং প্যাটার্ন ম্যাচিং একটি দেওয়া হয়। মরিচা রয়েছে এই আদিমতা, যাতে আমাদের দল দ্রুত স্থানান্তরিত করতে পারে এবং লজিককে পরিষ্কারভাবে প্রকাশ করতে পারে, যা অনুসন্ধান র্যাঙ্কিংয়ের মতো জটিল যুক্তি নিয়ে কাজ করার সময় গুরুত্বপূর্ণ।
- মাল্টি-থ্রেডেড মাল্টি-প্রসেস নয়: যেহেতু হরিজনডবিকে এসএসডি থেকে 100 জিবি ডেটা আনতে হবে, তাই একই মেমরির ঠিকানা স্থানটি লাভ করতে পারে এমন একটি একক প্রক্রিয়া থাকা আমাদের এপিআই স্তর ভাষার ধরণগুলি নোড.জেএসে মোতায়েন করা আরও দক্ষ, যা প্রতিটি কোরকে একটি নতুন প্রক্রিয়া উত্সর্গ করে।
রকসডিবি
https://rocksdb.org/
একটি ইন-প্রসেস লগ-কাঠামোগত মার্জ (এলএসএম) গাছ, আমাদের প্রাথমিক রেকর্ড স্টোর হিসাবে কাজ করে। এটি অবিশ্বাস্যভাবে দ্রুত, সাধারণত মাইক্রোসেকেন্ড প্রতিক্রিয়ার সময়গুলি অর্জন করে (এমনকি আরও অনেক বড় ডেটাসেট সহ, আরও দ্রুত অন্যান্য উচ্চ কার্যকারিতা সমাধান)।
এস 2
http://s2geometry.io/
এস 2 হ’ল গুগলের স্পেসিয়াল ইনডেক্সিং লাইব্রেরি যা একটি গোলকের উপরে কোয়াড্রি প্রজেক্ট করে, ও (এন) পয়েন্ট-ইন-পলিগন লুকআপগুলি ক্যাচেবল ধ্রুবক সময় সন্ধানে পরিণত করে। হরিজনডব লেখার সময় আমরা মরিচা বাইন্ডিং লিখেছিলাম গুগলের সি ++ লাইব্রেরি যা আমরা শীঘ্রই উত্স খুলব।
এফএসটিএস হ’ল একটি ডেটা স্ট্রাকচার যা দক্ষ স্ট্রিং সংক্ষেপণ এবং উপসর্গের প্রশ্নগুলি সরবরাহ করে। অ্যান্ড্রু গ্যালান্টের এই ব্লগ পোস্টটি কীভাবে এটি অর্জন করা হয় তা বিশদভাবে বর্ণনা করে। আমরা খুঁজে পেয়েছি যে আমাদের 80% ক্যোয়ারীগুলি সু-গঠিত ছিল এবং এই “সুখী পথগুলি” ক্যাশে করার জন্য একটি কার্যকর উপায় চেয়েছিল। এফএসটিএস ব্যবহার করে, আমরা এমবিএস অফ মেমরির ক্রমে এই কয়েক মিলিয়ন হ্যাপি-পাথকে ক্যাশে করতে সক্ষম হয়েছি এবং প্রায়শই একক-অঙ্কের মিলিসেকেন্ডের মধ্যে উপসর্গ প্রার্থীদের ফিরিয়ে দিয়েছি।
ট্যান্টিভ
https://github.com/quickwit-soss/tantantivy
লুসিনের অনুরূপ একটি প্রক্রিয়া উল্টানো সূচক গ্রন্থাগার।
আমরা কয়েকটি কারণে ইলাস্টিকসার্ক বা মেলিসার্কের মতো বাহ্যিক পরিষেবায় একটি প্রক্রিয়া সূচক ব্যবহার করার সিদ্ধান্ত নিয়েছি:
- অনুসন্ধানের মান: ঠিকানা বৈধতার মতো ব্যবহারের ক্ষেত্রে আমাদের পুনর্বিবেচনার উন্নতি করতে, আমরা প্রায়শই আমাদের অনুসন্ধানের কীওয়ার্ডগুলিকে গতিশীলভাবে “প্রসারিত” করি। এটি যদি আমরা কোনও বাহ্যিক পরিষেবা ব্যবহার করি তবে এটি তারের উপরে একাধিক প্রশ্ন প্রেরণে অনুবাদ করবে।
- অপারেশনাল সরলতা: সবকিছু একই প্রক্রিয়ার মধ্যে রয়েছে, তাই স্কেলিং অনুসন্ধান সার্ভারগুলি তুচ্ছ হয়ে যায়। মেমরি ম্যাপিং আমাদের বৃহত সূচকগুলির সাথে পণ্য হার্ডওয়্যার দক্ষতার সাথে ব্যবহার করার একটি উপায় দেয়। আমরা ইলাস্টিক অনুসন্ধান স্কেলিংয়ের চেয়ে অনেক সহজ পেয়েছি যেখানে জেভিএম প্যারামগুলিকে সুর করা এবং বর্ধিত বিলম্ব ছাড়াই সিপিইউকে পরিপূর্ণ করার চেষ্টা করা খুব কঠিন ছিল।
আমি
https://fasttext.cc/
নির্ভুলতা এবং অনুসন্ধানের গুণমান উন্নত করতে, আমরা আমাদের জিওকোডার কর্পাস এবং ক্যোয়ারী লগগুলির মিশ্রণ থেকে প্রশিক্ষিত একটি ফাস্টটেক্সট মডেল প্রয়োগ করেছি। ফাস্টটেক্সট সহ, আমরা এমএল অ্যাপ্লিকেশনগুলির জন্য উপযুক্ত একটি সংখ্যাসূচক ভেক্টর ফর্ম্যাটে একটি ক্যোয়ারিতে শব্দার্থগতভাবে শব্দের প্রতিনিধিত্ব করতে পারি। ফাস্টটেক্সটটি টাইপো-সহনশীল এবং এনজিআরএএম ব্যবহারের সাথে ভোকাবুলারি শব্দগুলি পরিচালনা করে। “কাছাকাছি” ভেক্টরগুলি শব্দার্থগতভাবে অনুরূপ শব্দের প্রতিনিধিত্ব করে যা আমাদের এমএল অ্যালগরিদমগুলিকে একটি অনুসন্ধানের প্রশ্নের মধ্যে একটি প্রদত্ত শব্দের শব্দার্থবিজ্ঞান বুঝতে দেয়।
লাইটজিবিএম
https://github.com/microsoft/lightgbm
আমরা অভিপ্রায়টির উপর নির্ভর করে ক্যোয়ারির অভিপ্রায় এবং ট্যাগ অংশগুলিকে শ্রেণিবদ্ধ করার জন্য একাধিক লাইটজিবিএম মডেল প্রশিক্ষণ দিয়েছি। এটি আমাদের অনুসন্ধানগুলি এবং নির্ভুলতার উন্নতি করে আমাদের প্রশ্নগুলি “কাঠামো” করতে দেয়। উদাহরণস্বরূপ, “নিউ ইয়র্ক” এর মতো আঞ্চলিক ক্যোয়ারী হিসাবে বিবেচিত একটি ক্যোয়ারী ঠিকানা অনুসন্ধান এড়িয়ে যেতে পারে, যেখানে “841 ব্রডওয়ে” এর মতো একটি ক্যোয়ারী আমাদের পোইস এবং অঞ্চলগুলি অনুসন্ধান এড়িয়ে যেতে দেয়।
অ্যাপাচি স্পার্ক
https://spark.apache.org/
স্পার্কের সাহায্যে আমরা কাছাকাছি-রৈখিক স্কেলাবিলিটি সহ এক ঘন্টারও কম সময়ে কয়েক মিলিয়ন ডেটা পয়েন্ট প্রক্রিয়া করতে সক্ষম হয়েছি। যোগদান বা সমষ্টিগুলি সম্পাদন করার সময় আমাদের প্রায়শই অনুকূল কর্মক্ষমতা অর্জনের জন্য কাজগুলি সুর করতে বা রিফ্যাক্টর করতে হত।
যেহেতু আমাদের ডেটা এস 3 তে লেখা হয়েছে, তাই এসকিউএল ব্যবহার করে অবজেক্ট স্টোরেজ সম্পদ পড়তে পারে এমন অ্যাপাচি প্রেস্টোর একটি হোস্টেড স্থাপনা অ্যামাজন অ্যাথেনার মাধ্যমে ফলাফলগুলি পরিদর্শন করা তুচ্ছ হয়ে ওঠে। ডাকডিবি হ’ল আরেকটি হালকা ওজনের সরঞ্জাম যা আমাদের ইঞ্জিনিয়াররা ফ্লাইতে এই সম্পদগুলি পরিদর্শন করতে ব্যবহার করে।
ফলাফল
হরিজনডব আমাদের ভূ -স্থান প্রদানের অপারেশনাল এবং বিকাশগত উভয় দিককেই রূপান্তরিত করেছে। আমরা ব্যয়, কর্মক্ষমতা এবং স্কেলিবিলিটির জন্য বোর্ড জুড়ে উন্নতি অর্জন করেছি:
- আমাদের পরিষেবাটি এখন দ্রুত, কার্যকরীভাবে সহজ এবং নির্ভরযোগ্য।
- আমাদের বিকাশকারীরা নতুন বৈশিষ্ট্য এবং ডেটা পরিবর্তনের সাথে দ্রুত চলাচল করতে সক্ষম। আমরা এক দিনের মধ্যে নতুন ডেটা উত্সগুলি খাওয়ার এবং মূল্যায়ন করতে সক্ষম।
- আমরা একাধিক মঙ্গো ক্লাস্টার, একটি বৃহত ইলাস্টিক অনুসন্ধান ক্লাস্টার এবং বেশ কয়েকটি জিও মাইক্রোসার্ভিসেস বন্ধ করে দিয়েছি, যা আমাদের মাসিক ব্যয়ে উচ্চ পাঁচ-চিত্র সংরক্ষণ করে।
আমরা হরিজনডবের সাথে আমাদের ডিজাইনের সিদ্ধান্তগুলি নিয়ে খুশি এবং অদূর ভবিষ্যতের জন্য আমাদের স্কেলের জন্য প্রস্তুত। আমরা কীভাবে ভবিষ্যতের ব্লগ পোস্টগুলিতে সিস্টেমের বিশেষ বৈশিষ্ট্যগুলি ডিজাইন করেছি তা স্পর্শ করব।
আমাদের কঠোর পরিশ্রমী প্রকৌশলী ব্র্যাডলি শোয়েনিউইস, জেসন লিউ, জ্যাকি ওয়াং, বিনহ রোবেলস, গ্রেগ সাদেটস্কি, ডেভিড গুরেভিচ এবং ফেলিক্স লি যারা এই সিস্টেমটিকে বাস্তবে পরিণত করেছিলেন তাদের অনেক ধন্যবাদ।
আমাদের সাথে যোগ দিন
রাডারটি কেবল একটি এপিআই স্তর থেকে বেশি। এসডিকে, মানচিত্র, ডাটাবেস এবং অবকাঠামো জুড়ে আমরা দ্রুততম, সর্বাধিক বিকাশকারী-বান্ধব অবস্থানের স্ট্যাকটি উপলব্ধ করার জন্য গ্রাউন্ড থেকে ভূ-স্থান সম্পর্কে পুনর্বিবেচনা করছি।
যদি এই ব্লগ পোস্টটি আপনার কাছে আকর্ষণীয় ছিল তবে আমরা বোর্ড জুড়ে দুর্দান্ত ইঞ্জিনিয়ারিং প্রতিভা নিয়োগ করছি।
আরও তথ্যের জন্য আমাদের কাজের পৃষ্ঠা দেখুন।