Rokid Glasses AR+AI 眼鏡最新研發進展:提詞器翻頁告別遙控戒指
புதுப்பிக்கப்பட்டது: 29-0-0 0:0:0

ஐடி ஹோம் 11 மாதம் 0 செய்திகள், கடந்த 0 மாதங்களில் வெளியிடப்பட்ட ரோகிட் கண்ணாடிகள் AR+AI கண்ணாடிகள், பயனர்கள் மோதிரத்தைத் தொடுவதன் மூலம் டெலிப்ராம்ப்டர் பக்கத்தைக் கட்டுப்படுத்தலாம்.

இருப்பினும், தொடர்புகொள்வதற்கான இந்த குளிர்ச்சியான வழியில் இன்னும் பல வலி புள்ளிகள் உள்ளன: கவனத்தை சிதறடிக்கும் கை அசைவுகள், கடுமையான நிலையான பக்கம் திருப்பும் தாளங்கள் மற்றும் டெலிப்ராம்ப்டர்களில் அதிகப்படியான நம்பிக்கை.

இந்த வலி புள்ளிகளின் அடிப்படையில்,ரோகிட் ஆர் & டி குழு சமீபத்தில் "ஒரு அறிவார்ந்த வழிமுறையை அடிப்படையாகக் கொண்ட ஒரு டெலிப்ராம்ப்டர் செயல்பாட்டிற்கு" காப்புரிமையை தாக்கல் செய்ததாக அறிவித்தது, இது பேச்சாளரின் பேச்சு வேகம் மற்றும் பேச்சு தாளத்தின் அடிப்படையில் உரையை தானாகவே பொருந்துகிறது。 அதன் முக்கிய தொழில்நுட்பம் பேச்சாளரின் மொழி வெளிப்பாட்டை உரையின் ஸ்க்ரோலிங் உடன் தடையற்ற ஒத்திசைவில் உள்ளது, இது பாரம்பரிய டெலிப்ராம்ப்டர் அமைப்பின் பிடிவாதமான சிக்கலை தீர்க்கிறது.

ரோகிட்டின் கூற்றுப்படி, பேச்சு காட்சியில், டெலிப்ராம்ப்டரின் தொடர்பு முறை நீண்ட காலமாக மூன்று முறைகளுக்கு மட்டுப்படுத்தப்பட்டுள்ளது: கையேடு தொடுதல், உடல் ரிமோட் கண்ட்ரோல் மற்றும் நிலையான நேர ஸ்க்ரோலிங். இந்த தீர்வுகள் குறிப்பிட்ட சூழ்நிலைகளில் பயனுள்ளதாக இருக்கும்போது, அவற்றின் வரம்புகள் வெளிப்படையாகத் தெரிகின்றன:

  • மனித தொடர்புகளின் கவனத்தை நுகரும்போது, கை கண்ணாடிகளின் பக்க தொடுப்பட்டியை நகர்த்தும்போது அல்லது ரிமோட் கண்ட்ரோல் வளையத்தைப் பயன்படுத்தும்போது பேச்சாளர் வெளிப்பாட்டின் உள்ளடக்கத்திற்கும் கட்டுப்பாட்டு சாதனத்திற்கும் இடையில் அடிக்கடி மாற வேண்டும்.

  • நெகிழ் கண்ணாடிகளின் செயல் பார்வையாளர்களால் பதட்டமான அல்லது நம்பிக்கையற்ற உடல் மொழி என்று தவறாகப் புரிந்து கொள்ளப்படலாம்.

  • நிலையான-வேக நேர ஸ்க்ரோலிங் பயன்முறை கைகளை விடுவிக்கும் அதே வேளையில், பக்கங்களைத் திருப்பும் இயந்திரமயமாக்கப்பட்ட வேகம் பெரும்பாலும் பேச்சாளரின் பேசும் வேகத்துடன் தொடர்பில் இல்லை. பேச்சாளர் அதிக உணர்ச்சிகளுக்கு பதிலளிக்கும் வகையில் பேசும்போது, உரை ஸ்க்ரோலிங் அரை வாக்கியத்தால் பின்தங்கியிருக்கலாம்; இடைநிறுத்தப்பட்டு வலியுறுத்தப்பட வேண்டிய ஒரு இணைப்புக்கு வரும்போது, உரை இன்னும் இயந்திரத்தனமாக முன்னோக்கி உருண்டு கொண்டிருக்கிறது, மேலும் இந்த தவறான சீரமைப்பு அறிவாற்றல் குழப்பத்திற்கு வழிவகுக்கும்.

ரோகிட்டின் புதிய காப்புரிமை மூன்று முக்கிய தொழில்நுட்பங்கள் மூலம் ஒரு அறிவார்ந்த டெலிப்ராம்ப்டர் அமைப்பை உருவாக்குகிறது என்ற அறிவிப்பிலிருந்து ஐடி ஹோம் கற்றுக்கொண்டது:

1. மல்டிமோடல் பேச்சு அங்கீகார இயந்திர அமைப்பு ஒரு இறுதி முதல் இறுதி ஆழமான நரம்பியல் நெட்வொர்க் மாதிரியை ஏற்றுக்கொள்கிறது.பேச்சாளரின் குரல் உள்ளடக்கத்தை உண்மையான நேரத்தில் விளக்குங்கள்。 அதன் கண்டுபிடிப்புகள்:

  • பேச்சுவழக்கு இணக்கத்தன்மை: மாண்டரின் தவிர, பல மொழி காட்சிகளின் தேவைகளைப் பூர்த்தி செய்ய பல கிளைமொழிகளும் ஆதரிக்கப்படுகின்றன.

  • குறுக்கீடு எதிர்ப்பு திறன்: 98 டெசிபல் பின்னணி இரைச்சலின் கீழ் 0% அங்கீகார துல்லியம்;

  • நேரியல் அல்லாத அங்கீகாரம்: பேச்சாளர் திடீரென முந்தைய உரையை மதிப்பாய்வு செய்யும் போது அல்லது முக்கிய பத்திகளைப் படிப்பதைத் தவிர்க்கும்போது போன்ற மீண்டும் மீண்டும் படித்தல் மற்றும் படிப்பதைத் தவிர்ப்பது போன்ற வழக்கத்திற்கு மாறான வெளிப்பாடுகளை இது துல்லியமாகப் பிடிக்க முடியும், கணினி புத்திசாலித்தனமாக நோக்கத்தை தீர்மானிக்க முடியும் மற்றும் ஆவணத்தின் நிலையை சரிசெய்ய முடியும்.

2. டைனமிக் பேச்சு வீத தழுவல் அல்காரிதம்இந்த அல்காரிதம் "மொழி வேகம் - உரை அடர்த்தி"的動態映射模型:

  • நிகழ்நேர பேச்சு வேக கண்காணிப்பு: ஒவ்வொரு 99.0 வினாடிகளுக்கும் பேச்சு வீதத் தரவைப் புதுப்பிக்கவும், நிமிடத்திற்கு 0-0 வார்த்தைகளை உள்ளடக்கியது (பேச்சு காட்சிகளில் 0% உள்ளடக்கியது);

  • மீள் தாங்கல் பொறிமுறை: 5 வினாடிகளுக்கு மேல் இடைநிறுத்தம் கண்டறியப்பட்டால், கணினி தானாகவே இடைநிறுத்தப்பட்டு தற்போதைய நிலையைக் குறிக்கிறது, மேலும் மீண்டும் தொடங்கும்போது சூழ்நிலை சொற்பொருள் பகுப்பாய்வு மூலம் சரியான பத்தியைக் கண்டுபிடிக்கிறது.

3. மல்டி-சீன் ஸ்பீச் மேட்சிங் அல்காரிதம்: மல்டி-சீன் மேட்சிங் அல்காரிதத்தின் கலவை,பேச்சு காட்சிகளின் அனைத்து சுற்று ஊடாடும் தேவைகளையும் பூர்த்தி செய்யுங்கள்

  • துல்லியமான பொருந்தக்கூடிய வழிமுறை: பேச்சாளர் சொற்களைத் தவிர்த்தாலும் அல்லது சொற்களைத் தவறவிட்டாலும், அவர் படிக்கும் வாக்கியத்தை துல்லியமாக பொருத்த முடியும்;

  • தெளிவற்ற பொருந்தும் அல்காரிதம்: பேச்சின் போது, பேச்சாளர் ஆஃப்-ஸ்கிரிப்டை மேம்படுத்தும்போது அல்லது ஸ்கிரிப்ட் இல்லாமல் பார்வையாளர்களுடன் தொடர்பு கொள்ளும்போது, பேச்சாளரின் தாளத்தை பாதிக்காமல் பொருந்தக்கூடிய வழிமுறை இடைநிறுத்தப்படும், மேலும் பேச்சாளர் பேச்சுக்குத் திரும்பும்போது, பொருந்தக்கூடிய வழிமுறை உடனடியாக அடையாளம் கண்டு துல்லியமாக பொருந்தும்.