TechWire

Google maps අලුත් කරන්න Deep Learning සහ Street View භාවිතය

Google maps කියන්නේ එදිනෙදා ජීවිතය smart වෙන්න යොදා ගන්න පුළුවන් Google විසින් නොමිලේ ලබාදෙන සේවාවක්. යන එන මග හොයාගන්න, traffic කොයිවගේද බලන්න වගේම අපිට වැදගත් වෙන ස්ථාන බලන්නත් Google maps යොදා ගන්න පුළුවන්. මේ වැඩිවෙන ඉල්ලුමත් එක්ක හොඳ සේවාවක් ලබාදෙන්න Google සමාගම විසින් විවිධ පර්යේෂණ වගේම අත්හදාබැලීම් කරනවා. Street View කියන සේවාව integrate කරල Google Maps update වෙනවා හැමදාම වගේ. Street View කාර් රථ මගින් බිලියන ගණන් ඡායාරුප රැස් කරනව. මේ images manually විශ්ලේෂණය කරන එක ප්‍රයෝගික වෙන්නේ නෑ. මේ සඳහා automated system එකක් හදන එක තමා Google’s Ground Truth කියන කණ්ඩායමට පැවරිලා තියෙන්නෙ.

මෙහි ප්‍රධාන කාර්යයක් වෙලා තියෙන්නෙ deep neural network එකක් මගින් හැම රටකම වගේ මාර්ගවල නම් හඳුනාගැනීම. Street view මගින් මාර්ගවල නාමපුවරුවල images ලබාගත්තම, ඒ images ඒ අය හදපු විශේෂිත වූ ගණිතමය ක්‍රමයක් (algorithm) මගින් සැකසීමකට ලක් කරලා තමයි නාමපුවරුවේ දැක්වෙන නම හොයාගන්නෙ. මෙය දැනට පවතින ඉතා සංකීර්ණ දත්ත ගොනුවක් වන French Street Name Signs (ප්‍රංශ මාර්ග නාම පුවරු) සඳහා 84.2%ක නිරවද්‍යතාවක් පෙන්වල තියෙනව. මෙය ඉතා විශාල ජයග්‍රහණයක් වන අතර මෙතරම් ඉහල නිරවද්‍යතාවක් නිසා දැන් එම කාර්යය වෙළදසැල්වල නාමපුවරුවල වෙළඳ නාමය ලබා ගැනීමටත් උපයෝගී කරන්න පටන් අරන්. එම ආකෘතිය GitHub මගින් ප්‍රසිද්ධ කර තිබෙනවා.

විවිධ කෝණවලින් ලබා ගත එකම නාමපුවරුව

Google maps වලට ඇති අභියෝග

මෙතෙක් තිබ්බ OCR එහෙම නැත්තම් Optical Character Recognition ක්‍රමය මගින් ඕනෑම තත්වයක් යටතෙදී අකුරු හඳුනාගැනීම කරන්න බැහැ. ඕනෑම තත්වයක් කියල අදහස් කරේ විවිධ දෘශ්‍ය අවස්ථාවන් වන අපරුපණ (distortion), අධිධාරණ (occlusion), අපැහැදිලිබව (blur), අපිරිසිදුබව (clutter) සහ විවිධ දෘෂ්ටි කෝණ (viewpoints). මෙම අපහසුතා මගහැර මේ ව්‍යාපෘතිය කිරීමට machine learning වගේම deep learning කියන තාක්ෂණ භාවිත කරනවා. මුලින්ම street view ව්‍යාපෘතිය කරන කොට මිනිසුන්ගේ privacy එක රකින්න මිනිසුන්ගේ මුහුණු හා වාහන අංක තහඩු blur කිරීමක් සිදු කරන්න සිදු වුණා. නමුත් ඒ සමගම සමහර දත්ත උපයෝගී කරගෙන google maps වැඩිදියුණු කිරීම ආරම්භ වුණා. එහි ඉදිරි පියවරක් තමයි මේ දැන් ආරම්භ වෙලා තියෙන්නෙ. පෙර කිව්වා blur කිරීම manually කරන්න බැරි නිසා neural network එකක් භාවිතයෙන් තමා කරලා තියෙන්නෙ. එයම තමයි මේ අලුත් වැඩේට අඩිතාලම වෙලා තියෙන්නෙ.

2014 දී මාර්ගවල බිම් කොටස් අංක හඳුගැනීම ආරම්භයට Street view house number දත්ත ගොනුව උපයෝගී කරගෙන තිබෙනවා. එහෙම පටන් ගත්තු ඒ ව්‍යාපෘතිය මගින් ලෝකයේ ⅓ වැඩි ප්‍රමාණයක් බිම් කොටස් අංක හඳුගැනීම සිදු කරල තියෙනවා. බ්‍රසීලය වගේ රටවල එම විශේෂිත වූ ගණිතමය ක්‍රමයේ (algorithm) නිරවද්‍යතාව 90% තරම් ඉහල මට්ටමක තිබෙනවා.

බ්‍රසීලයේදී AV. යන්න Avenida ලෙසත් Pres. Presidente ලෙසත් හඳුනාගැනීම

Av Avenue ලෙස හඳුනාගැනීම සහ 1600 ඉවත් කිරීම

අලුත් address?

2016 වෙද්දි තවත් දියුණු වෙමින් තවත් deep learning ආකෘතියක් ඉදිරිපත් වෙනවා. ඒ තමයි මාර්ග නම්පුවරුවල කෙටි නම් හඳුනාගෙන නිවැරදි විදියට නිරුපනය කරදීම. එමෙන්ම එකම කෙටි යෙදුමෙදී නිවැරදි අවස්ථාව හඳුනාගැනීමටත් එම මොඩලයට හැකි වෙනවා. ඒ වගේම නම්පුවරුවල තිබෙන අනවශ්‍ය වචන ඉවත්කර නිවැරදි යෙදුම පමණක් ලබා දීමටත් එම මොඩලයට හැකිවුණා.
මේ අලුත් ක්‍රමය සමග Google maps වල නොදන්න තැනකට ගියාම ඉන්න මාර්ගය හඳුනාගෙන අදාල ස්ථානයට අදාල ලිපිනය generate කරන්න පුළුවන් වෙලා තියෙනවා. ඒ අත්දැකීම ලංකාවෙදිත් අපිට අත්විදින්න පුළුවන්. විශේෂයෙන්ම Uber app එකෙන් තමන් ඉන්න තැන දුන්නම බොහෝවිට අංකයක් සමග තමන් ඉන්න අතුරු පාර පෙන්වනවා.

මින් නොනැවතී google විසින් ව්‍යාපාරික නමක් දුන්නම තියෙන තැනට navigate කරන්න කරන්න පුළුවන් ක්‍රමයක් ඇති කරන්න අමතක කරලා නෑ. ඒ සඳහා ව්‍යාපාරික ස්ථානවල තියෙන නාමපුවරු හඳුනගැනීම සහ ඊට අමතරව අදාල නම පමණක් උපුටා ගැනීමත් සිද්ධ වීම අවශ්‍යයයි.

පිටුපස කතාව

මේ සියලු වැඩකටයුතුවලට විශාල processing power එකක් ඕන වෙන බව ඕන කෙනෙක්ට තේරෙනවා ඇති. එකට හේතුව තමයි බිලියන 80ක් පමණ ඡායාරුප ගොනුවක් එකක් තමයි මේ දේවල් google විසින් සිදු කරන්නෙ. මේ කාර්යයන් කිරීමට Google TPU එහෙම නැත්තම් Tensor Processing Units භාවිත කරනවා. මේවා සමනය CPU හෝ GPUවලට වඩා ඉතා වේගවත් මෙන්ම කාර්යක්ෂමයි. මේ හේතු නිසා හා google විසින් මේ පර්යේෂණ සඳහා විශාල ආයෝජනයක් කරන නිසා තමයි අද වෙනකොට එදාට වඩා ගොඩක් දියුණු Google maps google usersලට ලැබිල තියෙන්නෙ.

                source

About author View all posts Author website

Pramodya Abeysinghe

Leave a Reply

Your email address will not be published. Required fields are marked *