പാടാന്‍ കഴിവുള്ള എഐ വികസിപ്പിച്ച് ഗവേഷകര്‍

ai that sings

മൈക്രോസോഫ്റ്റിലെയും സെജിയാങ് സർവകലാശാലയിലെയും ഗവേഷകരുടെ സംഘം ഡീപ്സിംഗർ എന്നറിയപ്പെടുന്ന ഒരു ബഹുഭാഷാ മൾട്ടി-സിംഗർ വോയ്‌സ് സിന്തസിസ് (എസ്‌വി‌എസ്) സംവിധാനം വികസിപ്പിച്ചെടുത്തിരിക്കുന്നു. പാട്ടുകളുടെ വെബ്സൈറ്റുകളില്‍ നിന്നുള്ള വിവരങ്ങള്‍ പരിശീലന ഡേറ്റയായി ഉപയോഗിച്ചാണ് ഈ എഐ സംവിധാനം വികസിപ്പിച്ചെടുത്തിരിക്കുന്നത്. ഇംഗ്ലീഷിലും ചൈനീസിലുമുള്ള ഗാനങ്ങള്‍ പാടുവാന്‍ ഇതിന് സാധിക്കുന്നതാണ്.

ആഴത്തിലുള്ള ന്യൂറൽ നെറ്റ്‌വർക്കുകളുടെ പുരോഗതിയോടെ, സിംഗിംഗ് വോയ്‌സ് സിന്തസിസ് (എസ്‌വി‌എസ്) വരികളിൽ നിന്ന് ആലാപന ശബ്ദങ്ങൾ സൃഷ്ടിക്കുന്നു. മെഷീനുകളെ സംസാരിക്കാൻ പ്രാപ്തരാക്കുന്ന ടെക്സ്റ്റ്-ടു-സ്പീച്ച് രീതിക്ക് സമാനമാണ് ഈ രീതി.

പരമ്പരാഗത എസ്‌വി‌എസ് കൂടുതലും മനുഷ്യ റെക്കോർഡിംഗിനെയും വ്യാഖ്യാനങ്ങളെയും ആശ്രയിച്ചിരിക്കുന്നു. കൂടാതെ, പരിശീലന ഡേറ്റയായി ഉയർന്ന നിലവാരമുള്ള ആലാപന റെക്കോർഡിംഗുകളും കൃത്യമായ ആലാപന മോഡലിംഗിനായി വരികളും ആലാപന ഓഡിയോയും തമ്മിലുള്ള കർശനമായ ഡേറ്റ വിന്യാസങ്ങളും ആവശ്യമാണ്. ഇത് ഡേറ്റ ലേബലിംഗിന്‍റെ ചിലവ് വർദ്ധിപ്പിക്കുന്നതും ആയിരുന്നു. ഈ വെല്ലുവിളികൾ ഡീപ്സിംഗർ എന്ന പുതിയ എസ്‌വി‌എസ് സംവിധാനത്തിന്‍റെ വികാസത്തിലേക്ക് നയിച്ചു.

ഡീപ്സിംഗറിന്‍റെ മേന്മ

• സംഗീത വെബ്‌സൈറ്റുകളിൽ നിന്നുള്ള പരിശീലന ഡേറ്റ നേരിട്ട് ഖനനം ചെയ്യുന്നതിനാൽ ഡീപ്സിംഗറിന്‍റെ പ്രവര്‍ത്തനം കാര്യക്ഷമമാണെന്ന് ഗവേഷകർ അഭിപ്രായപ്പെടുന്നു.
• വിന്യാസ ലേബലിംഗിനായുള്ള മനുഷ്യ ശ്രമങ്ങളെ ഇത് ഒഴിവാക്കുന്നു, ഇത് ചെലവ് കുറഞ്ഞ സാങ്കേതികതയാണ്.
• മുന്‍പത്തെ എസ്‌വി‌എസ് സിസ്റ്റങ്ങളേക്കാൾ ലളിതവും കാര്യക്ഷമവുമാണ് ഡീപ്സിംഗർ.
• നിരവധി ഭാഷകളിലും ഒന്നിലധികം ഗായകരിലും ആലാപന ശബ്ദങ്ങളെ സമന്വയിപ്പിക്കാൻ ഇതിന് കഴിയും.

റെക്കോര്‍ഡിങ് കഴിഞ്ഞ ഗാനങ്ങള്‍ക്കിടയില്‍ എന്തെങ്കിലും പിഴവുകള്‍ വന്നാല്‍ ആ ഭാഗം ആലപിക്കുന്നതിന് ഗായകരെ വീണ്ടും വിളിച്ചുവരുത്തേണ്ടതായ ഒരു സാഹചര്യം വരും. എന്നാല്‍ അങ്ങനെയുള്ള പിഴവുകള്‍ തിരുത്തുന്നതിനും ആ ഭാഗം ആ ഗായകന്‍റെയോ ഗായികയുടേയോ ശബ്ദത്തില്‍ തന്നെ ആലപിക്കുന്നതിനും ഡീപ്പ്സിംഗറിനെ ഉപയോഗിക്കാം.

ഡീപ്സിംഗർ സിസ്റ്റത്തിന്റെ ഫലപ്രാപ്തി വിലയിരുത്തുന്നതിന്, 89 ഗായകരും മൂന്ന് ഭാഷകളുമുള്ള 92 മണിക്കൂർ ഡേറ്റ ഉൾക്കൊള്ളുന്ന വെബിൽ നിന്ന് പൂർണ്ണമായും ഖനനം ചെയ്ത ആലാപന ഡേറ്റസെറ്റ് ഗവേഷകർ ഉപയോഗിച്ചു. ഗവേഷകർ പറയുന്നതനുസരിച്ച്, പിച്ച് കൃത്യതയെയും ശബ്ദ സ്വാഭാവികതയെയും അടിസ്ഥാനമാക്കി ഉയർന്ന നിലവാരമുള്ള ആലാപന ശബ്ദങ്ങളെ ഡീപ്സിംഗറിന് സമന്വയിപ്പിക്കാൻ കഴിയുമെന്ന് പരീക്ഷണ ഫലങ്ങൾ തെളിയിച്ചു.

About The Author

Be the first to comment

Leave a Reply

Your email address will not be published.


*