গুগল ডিপমিন্ড কি?

by জেরেমি লউকনেন

কিভাবে গভীর শিক্ষণ আপনি ব্যবহার পণ্য মধ্যে এমবেড করা হয়

গভীরমন্ডল দুটি বিষয় উল্লেখ করতে পারে: গুগলের কৃত্রিম বুদ্ধিমত্তা (এআই) এর পিছনে প্রযুক্তি এবং যে কৃত্রিম বুদ্ধিমত্তা বিকাশের জন্য দায়ী সেই কোম্পানী। ডাম্পিন্ড নামক কোম্পানীটি বর্ণমালার ইনকর্পোরেটেডের একটি সহায়ক সংস্থা যা Google এর প্যারেন্ট কোম্পানী এবং ডীপমিন্ডের কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিটি কয়েকটি গুগল প্রোজেক্ট এবং ডিভাইসে তার পথ খুঁজে পেয়েছে।

আপনি যদি গুগল হোম বা গুগল অ্যাসিস্টেন্ট ব্যবহার করেন তবে আপনার জীবন ইতোমধ্যে কিছু আশ্চর্যজনক উপায়ে গুগল ডিপমন্ডের সাথে ছেদ করেছে।

গুগল কীভাবে এবং কীভাবে ডিপমিন্ড পান?

দীপমন্ড ২011 সালে "বুদ্ধিমত্তাকে সংশোধন করে, এবং তারপর অন্য সবকিছুর সমাধান করার জন্য" এর লক্ষ্যের সাথে প্রতিষ্ঠিত হয়। প্রতিষ্ঠাতাগণ স্নায়ুবিজ্ঞানের বিষয়ে অন্তর্দৃষ্টি দিয়ে দক্ষতার সাথে জেনারেল হ'ল এলগরিদম গড়ে তোলার লক্ষ্যে মেশিন লার্নিংয়ের সমস্যা মোকাবেলা করে। প্রোগ্রাম করা প্রয়োজন ছাড়া বরং শিখতে।

এআই ক্ষেত্রের বেশ কয়েকটি বড় খেলোয়াড় বিপুল পরিমাণে প্রতিভা দেখেন যা দীপমেনকে একত্রিত করে, কৃত্রিম বুদ্ধিমত্তা বিশেষজ্ঞ ও গবেষকগণের মত, এবং ২01২ সালে ফেসবুকে কোম্পানির অর্জন করার জন্য একটি খেলা তৈরি করে।

ফেসবুকের চুক্তি ভিন্ন হয়ে যায়, তবে গুগল প্রায় অর্ধেক 500 মিলিয়ন ডলারের মধ্যে ২014 সালে ড্রপমিন্ডকে অপহরণ করে নেয়। তারপর 2015 সালে অনুষ্ঠিত Google কর্পোরেট পুনর্নির্মাণের সময় DeepMind তারপর বর্ণমালা ইনকর্পোরেটেড এর একটি সহায়ক সংস্থা হয়ে ওঠে।

গভীরমন্ডল ক্রয়ের পিছনে গুগলের মূল কারণ ছিল নিজেদের কৃত্রিম বুদ্ধিমত্তার গবেষণা শুরু করা। ডিপমিন্ডের প্রধান ক্যাম্পাস অধিগ্রহণের পর ইংল্যান্ডে লন্ডনে অবস্থান করছিলেন, তবে একটি প্রয়োগকারী দলটি Google পণ্যগুলির সাথে DeepMind এআইকে একীভূত করার জন্য মাউন্টেন ভিউতে ক্যালিফোর্নিয়ার মাউন্টেন ভিউতে গুগলের সদর দপ্তরে পাঠানো হয়েছিল।

গুগল ডীপমিন্ড এর সাথে কাজ কি?

বুদ্ধিমত্তার সমাধানের গভীরমন্দির লক্ষ্য যখন তারা Google- এ কীগুলি হস্তান্তর করে তখন তা পরিবর্তন হয় নি কাজ গভীর শেখার উপর অব্যাহত, যা মেশিন লার্নিং একটি টাইপ যা টাস্ক-নির্দিষ্ট নয়। এর মানে হল DeepMind একটি নির্দিষ্ট কাজের জন্য প্রোগ্রাম করা হয় না, পূর্বের এসিগুলির মত নয়।

উদাহরণস্বরূপ, আইবিএম এর ডিপ ব্লু বিখ্যাতভাবে দাবা গ্র্যান্ডমাস্টার গ্যারি কাসপারভকে পরাজিত করেছে যাইহোক, ডিপ ব্লুটি নির্দিষ্ট ফাংশনটি সম্পাদন করার জন্য ডিজাইন করা হয়েছিল এবং সেই এক উদ্দেশ্যটি বাইরে দরকারী ছিল না। অপরপক্ষে, DeepMind, অভিজ্ঞতা থেকে শিখতে ডিজাইন করা হয়েছে, যা তাত্ত্বিকভাবে অনেকগুলি বিভিন্ন অ্যাপ্লিকেশানে এটি দরকারী।

DeepMind এর কৃত্রিম বুদ্ধিমত্তার প্রাথমিক ভিডিও গেমগুলি কিভাবে শিখেছে, যেমন ব্রেকআউট, সেরা মানব প্লেয়ারের চেয়েও ভাল এবং শিখর গুন প্লেয়ারকে পাঁচ থেকে শূন্য পরাজিত করতে পরিচালিত একটি কম্পিউটার যান প্রোগ্রাম।

বিশুদ্ধ গবেষণা ছাড়াও, গুগল ডাম্পাইন্ড এআইকে তার প্রধান অনুসন্ধান পণ্য এবং হোম অ্যান্ড অ্যানড্রয়েড ফোনের মত ভোক্তা পণ্যগুলির সাথে সমন্বিত করে।

আপনার দৈনিক জীবনের উপর গুগল কীভাবে প্রভাব বিস্তার করে?

DeepMind এর গভীর লিংক সরঞ্জামগুলি Google এর পণ্য এবং পরিষেবাগুলির সমগ্র বর্ণের উপর প্রয়োগ করা হয়েছে, তাই আপনি যদি Google এর জন্য কিছু ব্যবহার করেন, তাহলে আপনি DeepMind এর সাথে কোনও ভাবেই যোগাযোগ করেছেন।

দীপমিন এআই এর বেশিরভাগ বিশিষ্ট জায়গাগুলি ব্যবহার করা হয়েছে বক্তৃতা স্বীকৃতি, ছবির স্বীকৃতি, জালিয়াতি সনাক্তকরণ, সনাক্তকরণ এবং স্প্যাম সনাক্তকরণ, হস্তাক্ষর স্বীকৃতি, অনুবাদ, রাস্তার দৃশ্য এবং এমনকি স্থানীয় অনুসন্ধান।

গুগলের সুপার-নির্ভুল স্পিচ স্বীকৃতি

বক্তৃতা স্বীকৃতি, বা কথ্য কমান্ড ব্যাখ্যা একটি কম্পিউটারের ক্ষমতা, প্রায় কাছাকাছি হয়েছে, কিন্তু Siri , Cortana , আলেক্সা এবং Google সহকারী পছন্দ এটি আমাদের দৈনন্দিন জীবনে আরো এবং আরো আনা হয়েছে।

গুগল এর নিজস্ব ভয়েস স্বীকৃতি প্রযুক্তি ক্ষেত্রে, গভীর শিক্ষণ মহান প্রভাব থেকে নিযুক্ত করা হয়েছে। বস্তুত, মেশিন লার্নিংকে Google এর ভয়েস স্বীকৃতি অনুমোদন করেছে যা ইংরেজির জন্য নির্ভুলতার একটি চূড়ান্ত পর্যায়ে পৌঁছেছে, যেখানে এটি একটি মানবিক শ্রোতা হিসেবে সঠিক।

আপনার যদি কোনও Google ডিভাইস থাকে, যেমন একটি অ্যান্ড্রয়েড ফোন বা Google হোম, আপনার জীবনের একটি সরাসরি, রিয়েল-ওয়ার্ল্ড অ্যাপ্লিকেশন রয়েছে। প্রত্যেকবার আপনি বলবেন, "ঠিক আছে, Google" একটি প্রশ্ন করে, ডীপমিন তার পেশীকে গুগল করে দেয় যাতে আপনি Google এর সাহায্যকারী বুঝতে পারেন যে আপনি কি বলছেন।

মেশিন লার্নিংয়ের বক্তৃতা স্বীকৃতির এই প্রয়োগের একটি অতিরিক্ত প্রভাব রয়েছে যা বিশেষ করে Google হোমে প্রযোজ্য। অ্যামাজন এর অ্যালকাসের মতো, যা ভালভাবে ভয়েস কমান্ডগুলি বুঝতে আটটি মাইক্রোফোনের ব্যবহার করে, গুগল হোমের ডীপমিন্ড-চালিত ভয়েস স্বীকৃতিটি কেবল দুটি প্রয়োজন।

গুগল হোম এবং সহকারী ভয়েস জেনারেশন

ঐতিহ্যবাহী বক্তৃতা সংশ্লেষণটি কম্পিটেন্যাটিক টেক্সট-টু-স্পিচ (টিটিএস) নামে কিছু ব্যবহার করে। যখন আপনি একটি ডিভাইসের সাথে মিথস্ক্রিয়া করেন যা বক্তৃতা সংশ্লেষণের এই পদ্ধতিটি ব্যবহার করে, এটি একটি স্প্রেড স্প্রেডগুলির পূর্ণ ডাটাবেস নিয়ে আলোচনা করে এবং শব্দ ও বাক্যগুলিতে তাদের একত্রিত করে। এটি অদ্ভুতভাবে অবাঞ্ছিত শব্দে বেরিয়ে আসে, এবং এটি সাধারণত বেশ স্পষ্ট হয় যে ভয়েসের পিছনে একটি মানুষ নেই।

ওয়েভনেট নামক একটি প্রকল্প নিয়ে গভীরমন্দে ভয়েস প্রজন্মের মোকাবেলা এটি কৃত্রিমভাবে উত্পন্ন কণ্ঠস্বর, যেমন আপনি যখন আপনার Google হোম বা Google সহায়তাকারীকে আপনার ফোনে কথা বলবেন, তখন আপনি যা শুনতে পাবেন তার চেয়ে অনেক বেশি প্রাকৃতিক শব্দ করতে পারবেন।

ওয়েভনেট সত্যিকারের মানব বক্তৃতাগুলির নমুনার উপর নির্ভর করে, কিন্তু এটি তাদের কাছে সরাসরি কিছু সংশ্লেষণ করার জন্য ব্যবহার করে না। পরিবর্তে, কাঁচা অডিও তরঙ্গাকৃতি কিভাবে কাজ করে তা শিখতে মানুষের বক্তৃতা নমুনা বিশ্লেষণ। এটি বিভিন্ন ভাষায় কথা বলতে, অ্যাক্সেস ব্যবহার করা বা এমনকি একটি নির্দিষ্ট ব্যক্তির মত শব্দ করার জন্য প্রশিক্ষিত হতে সহায়তা করে।

অন্যান্য টিটিএস সিস্টেমের মত, ওয়েভনেট নেট স্পীচ শব্দের সৃষ্টি করে, যেমন শ্বাস এবং লিপ-স্ম্যাকিং, এটি আরো বাস্তববাদী বলে মনে করতে পারে।

যদি আপনি কণ্ঠস্বর টেক্সট-থেকে-বক্তৃতা দ্বারা উত্পন্ন ভয়েস এবং ওয়েভনেট দ্বারা উত্পন্ন একটি ভয়েসের মধ্যে পার্থক্য শুনতে চান, তবে DeepMind এর কিছু খুব আকর্ষণীয় ভয়েস নমুনা রয়েছে যা আপনি শুনতে পারেন।

ডিপ লার্নিং এবং গুগল ফোটো অনুসন্ধান

কৃত্রিম বুদ্ধিবৃত্তির ছাড়া, ছবিগুলি অনুসন্ধান করা, ট্যাগের মতো প্রাসঙ্গিক সূত্রের উপর নির্ভর করে, ওয়েবসাইটের পার্শ্ববর্তী পাঠ্য এবং ফাইলের নাম। DeepMind এর গভীর শিক্ষণ সরঞ্জামগুলির মাধ্যমে, গুগল ফটোস সার্চ আসলে জিনিসগুলি কীভাবে দেখতে সক্ষম তা শিখতে সক্ষম হয়েছে, আপনি নিজের ইমেজ অনুসন্ধান করতে এবং কিছু ট্যাগ করার প্রয়োজন অনুযায়ী প্রাসঙ্গিক ফলাফল পেতে পারবেন।

উদাহরণস্বরূপ, আপনি "কুকুর" অনুসন্ধান করতে পারেন এবং এটি আপনার কুকুরের ছবিগুলি তুলে ধরবে, যদিও আপনি আসলে তাদের লেবেলযুক্ত না। এটা কারণ কুকুর মত চেহারা কি জানতে সক্ষম ছিল, মানুষ যা দেখছেন কি শিখতে যে একইভাবে অনেক ভাবে একইভাবে। এবং, Google এর কুকুর-অশান্ত গভীর গভীর স্বপ্নের মত, এটি বিভিন্ন চিত্রগুলির সব ধরণের সনাক্তকরণে 90 শতাংশের বেশি সঠিক।

গুগল লেন্স এবং ভিসুয়াল অনুসন্ধানে DeepMind

ডীপমিন্ড তৈরি করা সবচেয়ে দারুণ প্রভাবগুলোর একটি হলো গুগল লেন্স। এটি মূলত একটি ভিজ্যুয়াল সার্চ ইঞ্জিন যা আপনাকে বাস্তব জগতের কিছু ছবি তোলার এবং তাৎক্ষণিকভাবে এটি সম্পর্কে তথ্য তুলে ধরতে সহায়তা করে। এবং এটা DeepMind ছাড়া কাজ করবে না

বাস্তবায়নটি ভিন্ন হলেও, এটি Google+ চিত্র অনুসন্ধানে যে গভীর শিক্ষার ব্যবহার করা হয় তার অনুরূপ। আপনি যখন কোনও ছবি তুলেন, তখন Google লেন্স এটি দেখতে এবং বুঝতে পারে যে এটি কী। এর উপর ভিত্তি করে, এটি বিভিন্ন ফাংশন করতে পারে

উদাহরণস্বরূপ, যদি আপনি একটি বিখ্যাত ল্যান্ডমার্কের ছবি তুলেন, এটি ল্যান্ডমার্ক সম্পর্কে তথ্য সরবরাহ করবে, অথবা যদি আপনি একটি স্থানীয় স্টোরের ছবি তুলতে পারেন তবে এটি সেই দোকানের তথ্য তুলে ধরতে পারে। যদি ছবিতে একটি ফোন নম্বর বা ইমেল ঠিকানা অন্তর্ভুক্ত থাকে তবে Google লেনসও তা স্বীকার করতে সক্ষম এবং এটি আপনাকে নম্বরটি কল করার বা একটি ইমেল পাঠানোর বিকল্প দেবে।