മനുഷ്യഭാഷ മനസ്സിലാക്കി യുക്തിപരമായി പ്രവർത്തിക്കാൻ കഴിവുള്ള റോബോട്ടുകളുടെ യുഗം ഇങ്ങടുത്തെത്തി. റോബോട്ടിക്സ് ലോകത്തിന് പുതിയ ദിശാബോധം നൽകി, ഗൂഗിൾ അത്യാധുനിക വിഷ്വൽ-ലാംഗ്വേജ് മോഡൽ (VLM) ആയ Gemini Robotics-ER 1.5 പുറത്തിറക്കി. മനുഷ്യന്റെ ഭാഷയും ദൃശ്യലോകവും ഒരേപോലെ മനസ്സിലാക്കി, യുക്തിപരമായി പ്രവർത്തിക്കാൻ കഴിവുള്ള ഈ സാങ്കേതികവിദ്യ, റോബോട്ടിക്സ് രംഗത്ത് ഒരു പുതിയ യുഗപ്പിറവി കുറിക്കുമെന്ന് വിലയിരുത്തപ്പെടുന്നു.
ഗൂഗിൾ പറയുന്നതനുസരിച്ച്, മനുഷ്യന്റെ സാധാരണ ഭാഷയിലുള്ള നിർദ്ദേശങ്ങൾ മനസ്സിലാക്കാനും, സ്വതന്ത്രമായി യുക്തിപരമായ തീരുമാനങ്ങൾ എടുക്കാനുമുള്ള ശേഷി Gemini Robotics-ER 1.5 വഴി യന്ത്രങ്ങൾക്ക് ലഭിക്കും. ദൃശ്യ ഡാറ്റയും ഭാഷാ വ്യാഖ്യാനവും സമന്വയിപ്പിക്കുന്ന ഈ സംവിധാനം, ഭൗതിക ലോകത്തെ സാഹചര്യങ്ങൾ കൃത്യമായി വിലയിരുത്തി പ്രതികരിക്കാൻ റോബോട്ടുകളെ സഹായിക്കും.
ജെമിനി റോബോട്ടിക്സ്-ER 1.5-നെ വിപ്ലവകരമാക്കുന്ന നാല് പ്രധാന സവിശേഷതകൾ ഇവയാണ്:
സ്വയം പ്രവർത്തിക്കാനുള്ള കഴിവ് (Enhanced Autonomy): മുൻകൂട്ടി പ്രോഗ്രാം ചെയ്യാത്ത, സങ്കീർണ്ണമായ സാഹചര്യങ്ങളിൽ പോലും റോബോട്ടുകൾക്ക് സ്വന്തമായി യുക്തിപൂർവ്വം തീരുമാനങ്ങളെടുക്കാനും അത് നടപ്പിലാക്കാനും കഴിയും.
സ്വാഭാവിക ഭാഷ മനസിലാക്കും (Natural Language Interaction): “ഈ ഫയൽ എടുക്കൂ”, “മേശ വൃത്തിയാക്കൂ” തുടങ്ങിയ മനുഷ്യൻ സംസാരിക്കുന്ന സാധാരണ വാചകങ്ങൾ റോബോട്ടുകൾക്ക് നേരിട്ട് മനസ്സിലാക്കി കൃത്യമായി നിർവഹിക്കാൻ സാധിക്കും.
ജോലി വിഭജിക്കാനുള്ള കഴിവ് (Task Orchestration): സങ്കീർണ്ണമായ ഒരു വലിയ കമാൻഡ് ലഭിച്ചാൽ അതിനെ യുക്തിസഹമായ ചെറിയ ഉപ ടാസ്കുകളായി വിഭജിച്ച്, ക്രമത്തിൽ പൂർത്തിയാക്കാനുള്ള കഴിവ് ഈ മോഡലിനുണ്ട്. വ്യാവസായിക, ആരോഗ്യ, ഓഫീസ് മേഖലകളിൽ ഉൽപാദനക്ഷമത കുത്തനെ വർദ്ധിപ്പിക്കാൻ ഈ കഴിവ് സഹായിക്കും.
സമഗ്രമായ കഴിവുകൾ (Versatile Capabilities): വസ്തുക്കളെ തിരിച്ചറിയാനും അവയുടെ സ്ഥാനം, രൂപം, പരസ്പര ബന്ധം എന്നിവ മനസ്സിലാക്കുവാനും സാധിക്കും, ഉദാഹരണമായി ഒരു വസ്തുവിനെ എടുക്കേണ്ടിവരികയാണെങ്കിൽ, എവിടെ പിടിക്കണം എന്ന് യുക്തിപരമായി തീരുമാനമെടുത്ത്, അത് വളരെ സൂക്ഷ്മമായി കൈകാര്യം ചെയ്യുക. ചുറ്റുപാടുകൾ മാറുന്നതനുസരച്ച് തീരുമാനങ്ങൾ എടുക്കാനും അതിവേഗം പ്രതികരിക്കാനും ഈ റോബോട്ടുകൾക്ക് സാധിക്കും.
മനുഷ്യൻ-യന്ത്ര സഹകരണത്തിന്റെ ഭാവി
മനുഷ്യഭാഷയും യന്ത്രബുദ്ധിയും സംയോജിപ്പിച്ച ഈ സാങ്കേതികവിദ്യ, റോബോട്ടുകളെ പ്രോഗ്രാം ചെയ്ത ഉപകരണം യുക്തിപരമായി ചിന്തിക്കുന്ന ‘സഹപ്രവർത്തകരാക്കി’ മാറ്റുമെന്ന് Google Robotics വിഭാഗം വ്യക്തമാക്കി. “റോബോട്ടുകൾ ഇനി വാക്കുകൾ കേൾക്കുന്നത് മാത്രമല്ല, അവയുടെ അർത്ഥം മനസ്സിലാക്കുകയും യുക്തിപരമായി പ്രയോഗിക്കുകയും ചെയ്യും,” അവർ കൂട്ടിച്ചേർത്തു.
ആരോഗ്യപരിചരണം, വ്യാവസായിക ഉൽപാദനം, വിദ്യാഭ്യാസം, ഓഫീസ് ഓട്ടോമേഷൻ തുടങ്ങിയ നിരവധി മേഖലകളിൽ Gemini Robotics-ER 1.5-ന്റെ പ്രയോഗ സാധ്യതകൾ വളരെ വലുതാണ്. സർക്കാർ ഓഫീസുകളിലും വീടുകളിലും മനുഷ്യർക്കൊപ്പമുള്ള ബുദ്ധിമാനായ സഹപ്രവർത്തകരായി റോബോട്ടുകൾ ഉടൻ തന്നെ എത്തുമെന്നാണ് വിദഗ്ധരുടെ അഭിപ്രായം.
സ്വാഭാവിക ഭാഷയും ദൃശ്യം മനസ്സിലാക്കലും സമന്വയിപ്പിച്ചുകൊണ്ടുള്ള ഗൂഗിളിന്റെ ഈ പുതിയ കാൽവെയ്പ്പ്, റോബോട്ടുകളെ മനുഷ്യന്റെ ആശയവിനിമയത്തിലേക്കും സേവനമേഖലകളിലേക്കും കൂടുതൽ അടുപ്പിക്കുന്നു. മനുഷ്യഭാഷ മനസ്സിലാക്കുന്ന റോബോട്ടുകളുടെ യുഗം ഇതോടെ ആരംഭിച്ചിരിക്കുന്നു.
