ഗൂഗിളിന്റെ ജനപ്രിയ എഐ ഇമേജ് ജനറേഷൻ സേവനമായ നാനോ ബനാനയുടെ രണ്ടാം പതിപ്പ് പുറത്തിറങ്ങി. ദശലക്ഷക്കണക്കിന് ഉപയോക്താക്കളെ ആകർഷിച്ച ആദ്യ പതിപ്പിനേക്കാൾ ഏറെ കരുത്തുറ്റതും കൃത്യതയുള്ളതുമായ മാറ്റങ്ങളുമായാണ് ‘നാനോ ബനാന 2’ എത്തിയിരിക്കുന്നത്. ചിത്രങ്ങൾക്കുള്ളിലെ അക്ഷരങ്ങൾ (Text Rendering) കൃത്യമായി രേഖപ്പെടുത്തുന്നതിൽ മുൻകാല എഐ മോഡലുകൾ നേരിട്ടിരുന്ന പ്രധാന വെല്ലുവിളി പരിഹരിച്ചുവെന്നതാണ് ഈ പുതിയ പതിപ്പിന്റെ ഏറ്റവും വലിയ പ്രത്യേകത.
ചിത്രങ്ങളിൽ വ്യക്തമായി വായിക്കാവുന്ന തരത്തിൽ വാക്കുകൾ ഉൾപ്പെടുത്താനും അവ വിവിധ ഭാഷകളിലേക്ക് തത്സമയം വിവർത്തനം ചെയ്യാനും നാനോ ബനാന 2-ന് സാധിക്കും. ഗൂഗിൾ ജെമിനിയുടെ (Gemini) വിപുലമായ അറിവും വെബ് സെർച്ചിൽ നിന്നുള്ള തത്സമയ വിവരങ്ങളും ഉപയോഗിക്കുന്നതിനാൽ, സങ്കീർണ്ണമായ ഇൻഫോഗ്രാഫിക്സുകളും ഡയഗ്രമുകളും ഡാറ്റാ വിഷ്വലൈസേഷനുകളും നിർമ്മിക്കാൻ ഈ പുതിയ എഞ്ചിൻ പ്രാപ്തമാണ്.
മറ്റൊരു ശ്രദ്ധേയമായ സവിശേഷത ‘സബ്ജക്റ്റ് കൺസിസ്റ്റൻസി’ (Subject Consistency) ആണ്. അതായത്, ഒരു കഥയിലെ കഥാപാത്രത്തെയോ വസ്തുവിനെയോ മാറ്റമില്ലാതെ ഒന്നിലധികം ചിത്രങ്ങളിൽ തുടർച്ചയായി നിലനിർത്താൻ ഇതിലൂടെ സാധിക്കും. അഞ്ച് കഥാപാത്രങ്ങളെയും 14 വസ്തുക്കളെയും വരെ ഇത്തരത്തിൽ ഒരേപോലെ വിവിധ സീനുകളിൽ കൊണ്ടുവരാൻ കഴിയുന്നത് ഡിസൈനർമാർക്കും സ്റ്റോറി ബോർഡ് കലാകാരന്മാർക്കും വലിയ സഹായമാകും.
മികച്ച ടെക്സ്ചറുകൾ, മൂർച്ചയുള്ള വിശദാംശങ്ങൾ, കൂടുതൽ വ്യക്തമായ വെളിച്ചം എന്നിവയോടെ പ്രൊഫഷണൽ നിലവാരമുള്ള ചിത്രങ്ങളാണ് പുതിയ എഞ്ചിൻ വാഗ്ദാനം ചെയ്യുന്നത്. ഉപയോക്താവ് നൽകുന്ന സങ്കീർണ്ണമായ നിർദ്ദേശങ്ങൾ (Prompts) അതിന്റെ എല്ലാ സൂക്ഷ്മതയോടെയും ഉൾക്കൊള്ളാൻ ഇതിന് പ്രത്യേക കഴിവുണ്ട്. സോഷ്യൽ മീഡിയ പോസ്റ്റുകൾ മുതൽ പ്രൊഫഷണൽ പ്രോജക്റ്റുകൾക്ക് വരെ അനുയോജ്യമായ രീതിയിൽ ഏത് ആസ്പെക്റ്റ് റേഷ്യോയിലും റെസല്യൂഷനിലും ചിത്രങ്ങൾ ഇനി നിർമ്മിക്കാം. എഐ ചിത്രരചനയുടെ അടുത്ത ഘട്ടത്തിലേക്കുള്ള വലിയൊരു ചുവടുവെപ്പായിട്ടാണ് സാങ്കേതിക ലോകം നാനോ ബനാന 2-നെ കാണുന്നത്.
