কি-মানে ক্লাস্টারিং কি?

K- মানে অ্যালগরিদম সঙ্গে ডেটা মাইনিং

K- মানে ক্লাস্টারিং অ্যালগরিদম হল একটি ডেটা মাইনিং এবং মেশিন লার্নিং টুল যা ঐসব সম্পর্কের পূর্বে কোনও জ্ঞান ছাড়াই সম্পর্কিত পর্যবেক্ষণের গোষ্ঠীগুলির পর্যবেক্ষণ পর্যবেক্ষণ করে। নমুনা দ্বারা, অ্যালগরিদম দেখায় যে কোন বিভাগ, বা ক্লাস্টার, ডেটা অন্তর্ভুক্ত, মান দ্বারা সংজ্ঞায়িত ক্লাস্টারগুলির সংখ্যার সঙ্গে

K- মানে অ্যালগরিদম সহজ ক্লাস্টারিং কৌশল এক এবং এটা সাধারণত চিকিৎসা ইমেজিং, বায়োমেট্রিক্স, এবং সম্পর্কিত ক্ষেত্রগুলিতে ব্যবহৃত হয়। K- মানে ক্লাস্টারিং হল যে এটি আপনার তথ্য (তার unsupervised ফর্ম ব্যবহার করে) পরিবর্তে ডেটা (অ্যালগরিদম তত্ত্বাবধানে ফর্ম ব্যবহার করে) সম্পর্কে অ্যালগরিদম নির্দেশ না করে।

এটি কখনও কখনও লয়েড এর অ্যালগরিদম হিসাবে উল্লেখ করা হয়, বিশেষ করে কম্পিউটার বিজ্ঞান চেনাশোনাগুলিতে কারণ স্টুয়ার্ট লয়েড দ্বারা 1957 সালে প্রথম প্রস্তাবিত মান অ্যালগরিদম। "ক-অর্থ" শব্দটি 1967 সালে জেমস ম্যাকউইয়েন

কিভাবে k- মানে আলগোরিদিম কার্যাবলী

K- মানে অ্যালগরিদম হল একটি বিবর্তনীয় অ্যালগরিদম যা তার অপারেশন পদ্ধতি থেকে তার নাম লাভ করে। অ্যালগরিদম ক্লাস্টারগুলি কে গ্রুপে পর্যবেক্ষণ করে, যেখানে k একটি ইনপুট প্যারামিটার হিসাবে সরবরাহ করা হয়। এটি ক্লাস্টারের গড়ের পর্যবেক্ষণের নৈকট্যের উপর ভিত্তি করে ক্লাস্টারগুলিতে প্রতিটি পর্যবেক্ষণ প্রদান করে। ক্লাস্টার এর মানেটি আবার পুনঃপ্রচলিত হয় এবং প্রক্রিয়া আবার শুরু হয়। এখানে কিভাবে অ্যালগরিদম কাজ করে:

  1. অ্যালগরিদম প্রাথমিকভাবে প্রাথমিক ক্লাস্টার কেন্দ্রে (অর্থ) হিসাবে k পয়েন্ট নির্বাচন করে।
  2. ডেটাসেটের প্রতিটি পয়েন্ট বদ্ধ ক্লাস্টারের জন্য নির্ধারিত হয়, প্রতিটি পয়েন্ট এবং প্রতিটি ক্লাস্টার কেন্দ্রের মধ্যে ইউক্লিডিয়ান দূরত্বের উপর ভিত্তি করে।
  3. প্রতিটি ক্লাস্টার কেন্দ্রকে সেই ক্লাস্টারে পয়েন্টের গড় হিসেবে পুনঃনির্ধারণ করা হয়।
  4. ক্লাস্টার একত্রিত না হওয়া পর্যন্ত পদক্ষেপ 2 এবং 3 পুনরাবৃত্তি। সংযোজনটি বাস্তবায়নের উপর নির্ভর করে ভিন্নভাবে সংজ্ঞায়িত করা যেতে পারে, তবে সাধারণভাবে এর মানে হচ্ছে যে পদক্ষেপগুলি 2 এবং 3 বার পুনরাবৃত্তি করা হয়, অথবা পরিবর্তনগুলি ক্লাস্টারগুলির সংজ্ঞাে বস্তুগত পার্থক্য না করে যখন কোন পর্যবেক্ষন ক্লাস্টার পরিবর্তন করে না।

ক্লাস্টার সংখ্যা নির্বাচন

কে- এর প্রধান অসুবিধা হল ক্লাস্টারিং মানে হল যে আপনি অ্যালগরিদম একটি ইনপুট হিসাবে ক্লাস্টার সংখ্যা নির্দিষ্ট করা আবশ্যক। পরিকল্পিত হিসাবে, অ্যালগরিদমটি সঠিক সংখ্যক ক্লাস্টার নির্ধারণে সক্ষম নয় এবং এটি ব্যবহারকারীকে অগ্রগতিতে সনাক্ত করার উপর নির্ভর করে।

উদাহরণস্বরূপ, যদি আপনি এমন একটি গ্রুপের লোক থাকেন যা বাইনারি লিঙ্গ পরিচয়ের ভিত্তিতে পুরুষ বা মহিলা হিসাবে কাস্ট্রাস্ট করা হয় , তাহলে k = মানে অ্যালগরিদমকে ইনপুট k = 3 ব্যবহার করে লোকেদের তিনটি ক্লাস্টারের মধ্যে বাধ্যতামূলক করে যখন শুধুমাত্র দুটি, অথবা k = 2 ইনপুট , একটি আরো প্রাকৃতিক উপযুক্ত প্রদান করবে।

একইভাবে, যদি কোনও ব্যক্তির গোষ্ঠী হোম স্টেটের উপর ভিত্তি করে সহজেই ক্লাস্টার হয়ে থাকে এবং আপনি k = মানে অ্যালগরিদমকে ইনপুট k = 20 দিয়ে ডাকেন , ফলাফলগুলি খুব কার্যকর হতে পারে।

এই কারণে, আপনার ডেটা অনুসারে সবচেয়ে উপযুক্ত মানটি চিহ্নিত করতে কে-এর বিভিন্ন মানগুলির সাথে প্রায়ই এটি ব্যবহার করা ভাল ধারণা। আপনি মেশিন-শিখেছি জ্ঞান জন্য আপনার খোঁজে অন্যান্য ডেটা মাইনিং আলগোরিদিম ব্যবহার অন্বেষণ করতে ইচ্ছুক হতে পারে।