+
T12: un système d'entrée de texte avancé avec le soutien phonétique pour les appareils mobiles Le système de saisie de texte T9 populaires pour les appareils mobiles utilise un système de désambiguïsation avec dictionnaire prédictif, permettant à un utilisateur de taper des mots couramment utilisés avec une faible surcharge. Nous présentons un nouveau système de saisie de texte appelé T12, qui, en plus de fournir des capacités T9S, permet également à un utilisateur de faire défiler les choix possibles en fonction de la similitude phonétique, et d'élaborer des abréviations couramment utilisées, les acronymes et autres formes courtes. Cette capacité à faire défiler les choix possibles agit comme un vérificateur d'orthographe, qui fournit des suggestions du dictionnaire avec la prononciation similaire à celle du mot d'entrée. Les chiffres de cette publication Texte intégral DOI: Disponible à partir de: Mumit Khan Cliquez pour voir le texte intégral de: Article: T12: un système d'entrée de texte avancé avec le soutien phonétique pour les appareils mobiles T12: UN SYSTÈME TEXTE D'ENTRÉE AVANCÉE AVEC SUPPORT PHONETIC POUR DISPOSITIFS MOBILES Naushad Uzzaman BRAC University Bangladesh naushad @ bracuniversity Mumit Khan BRAC University Bangladesh Mumit @ bracuniversity Résumé Le système de saisie de texte T9 populaires pour les appareils mobiles utilise un système de désambiguïsation avec dictionnaire prédictif, permettant à un utilisateur de taper des mots couramment utilisés avec une faible surcharge. Nous présentons un nouveau système de saisie de texte appelé T12, qui en plus de fournir des capacités de T9, permet également à un utilisateur de faire défiler les choix possibles en fonction de la similitude phonétique, et d'élaborer des abréviations couramment utilisées, les acronymes et les autres formes courtes. Cette capacité à faire défiler les choix possibles agit comme un vérificateur d'orthographe, qui fournit des suggestions du dictionnaire avec la prononciation similaire à celle du mot d'entrée. Mots clés: T9, T12, saisie de texte, services de communication sans fil, SMS, e-mail, la similitude phonétique, vérificateur d'orthographe. L'augmentation considérable de l'utilisation mobile ces dernières années a créé une forte demande pour les systèmes de saisie de texte efficace pour les appareils mobiles clés en manque. Les systèmes de saisie de texte sont nécessaires non seulement pour les SMS (Short Message Service), mais aussi e-mail, l'accès à Internet, contacts, calendrier, notes, liste de tâches et de nombreuses autres applications. Un régime populaire pour la saisie de texte T9 est (1), qui permet à l'utilisateur d'utiliser les touches 9 sur le clavier mobile pour saisir du texte, puis pour faire défiler les choix possibles en utilisant une autre clé, appelée la clé suivante. Alors que T9 permet homonymie basée sur le dictionnaire et la liste de fréquence, il ne permet pas à l'utilisateur d'élaborer des acronymes couramment utilisés, des abréviations et des formes courtes que les utilisateurs mobiles utilisent souvent, MacKenzie et al (2). Elle ne permet pas un mécanisme de prédiction basée sur la similitude phonétique, ce qui est très utile dans les langues où l'orthographe sont souvent phonétique dans la nature en raison des règles orthographiques spécifiques à la langue, et aussi lors de l'utilisation des formes courtes phonétiquement similaires. T12, notre système de saisie de texte proposé étend T9 avec ces fonctionnalités. Les formes courtes phonétiquement similaires couramment utilisées vont de l'utilisation 2morrow au lieu de demain, au lieu de 4 pour, ppl à la place des gens, r pour sont, etc. Les acronymes et les abréviations sont également assez fréquentes, telles que BTW plutôt que par la manière, l'OMI dans mon opinion, etc. Lorsque vous utilisez une application de messagerie, l'utilisateur peut souhaiter que ces derniers soient écrits en utilisant la forme courte, mais le système d'entrée de traduire ceux-ci à la forme élaborée pour le destinataire. Avec T12, l'utilisateur est capable d'écrire la forme courte, puis utilisez la touche Suivant pour faire défiler les choix possibles et choisir la forme élaborée si disponible dans le dictionnaire. Lorsque vous utilisez une autre application, l'exigence peut être cependant tout à fait le contraire. Dans le cas des SMS (Short Message Service), l'exigence est que les messages soient aussi courts que possible, en raison de la limite de 128 ou 160 caractères par message (3). La solution de T12 est alors de convertir les mots pour mots sonores similaires courtes formes ou acronymes en parcourant les choix en utilisant la touche suivante, réduisant la longueur des messages. Par exemple, les mots de téléphone et de formule convertis en fone, 4mula par défiler. T12 permet également à l'utilisateur de vérifier l'orthographe en utilisant la mesure de similitude phonétique. 2. SAISIE DE TEXTE SUR LES DISPOSITIFS MOBILES Contrairement claviers QWERTY, des claviers de téléphones portables a 12 touches la plupart des cas. Donc, ces claviers doivent utiliser une clé pour représenter plusieurs entrées. Sur ces claviers, les caractères sont généralement regroupés en ensembles et les ensembles sont liés à une touche particulière. mise en page la plus utilisée est, ABC lié à la clé 2, DEF à la clé 3, GHI à la clé 4, JKL à 5, MNO à 6, PQRS à 7, TUV à 8 et WXYZ à 9. Il existe actuellement deux méthodes d'entrée ambiguës utilisées sur appareils mobiles: un seul robinet et multi-tap (4). Dans le mode multi-tap les cycles de caractères d'entrée à chaque pression de sa touche correspondante. Utilisation de la mise en page ci-dessus, la lettre H peut être entré en appuyant deux fois sur la touche 4. Lorsque l'utilisateur appuie sur une touche différente, ou attend un délai de temporisation, le caractère précédent est fixé dans l'entrée. Dans la méthode unique robinet de chaque pression de touche peut représenter l'un de ses caractères associés. Les séquences de touches appropriées peuvent alors représenter un mot qui peut être construit à partir des caractères dans l'ordre où ils ont été introduits. Si plus d'un mot est associé à une séquence de touches (par exemple 7468 produit «pinte» et «émeute», entre autres), l'utilisateur peut faire défiler l'ensemble disponible en utilisant une autre touche du clavier. En termes d'efficacité entrant mot, appuyez sur simple est une amélioration considérable par rapport à prises multiples, bien que cette efficacité dépend de: (i) si le mot recherché par l'utilisateur se trouve dans la base de données unique robinet, et (ii) la l'ordre dans lequel les mots liés à un clavier la séquence est présentée à l'utilisateur. Le premier de ces problèmes peuvent être résolus que par un choix judicieux du corpus utilisé pour construire la base de données unique robinet. Si nous supposons que la base de données contient la plupart des mots requis par l'utilisateur, la question de l'ordre de sélection de texte fournit la plus grande source d'inefficacité potentielle pour l'utilisateur, Hawes et Keller (5). 3. Pourquoi le nom T12? entrée du robinet unique décrit ci-dessus est T9, ce qui signifie texte dans 9 Keys. Nous vous proposons T12, ce qui signifie texte à l'aide de 12 touches. Buts de touche 2 à 9 sont décrits ci-dessus de Hawes et Keller (5). Parmi les autres touches, 1 est lié à des ponctuations et des symboles (- '@ etc..); touche 0 est lié à l'espace; touche * est lié comme la clé suivante pour faire défiler les choix possibles dans le système T9 de saisie de texte, produisant des mots avec la même séquence de touches; et la clé # lié à défiler pour la méthode T12, produisant des mots avec la même prononciation, acronymes, et a élaboré des formulaires. La figure 1 montre la disposition clé de notre système de saisie de texte proposé T12. Figure 1: Image d'un clavier portable avec la fonctionnalité proposée 4. DÉFIS POUR T12 Comme décrit dans les sections précédentes, T12 permet à l'utilisateur d'utiliser soit la forme courte qui peut être élaboré, ou la forme longue qui peut être raccourcie. Il y a assez peu de difficultés dans la mise en œuvre de cette capacité, et nous décrivent certains de ces ci-dessous. 1. Compte tenu de la nature non-phonétiques de l'anglais, et ses règles orthographiques complexes, les fautes d'orthographe sont souvent phonétiquement similaire au mot recherché. Dans la culture de l'Internet, en particulier lors de l'utilisation d'applications de messagerie et de discussion instantanée, les utilisateurs utilisent souvent intentionnellement la version mal orthographié ainsi. Par exemple, fone pour téléphone, grille pour grande, kat pour chat, etc. 2. Les utilisateurs souvent omettre les voyelles lorsque l'orthographe de certains mots couramment utilisés. Par exemple r pour sont, ppl pour les personnes, etc. 3. Il y a aussi une tendance à l'aide de chiffres pour remplacer les consonnes sonores similaires ou séquence de lettres. Par exemple, 4 pour pour, 2morrow pour demain, etc. 4. Il y a un nombre toujours croissant de «acronymes Internet» qui sont d'usage courant. Par exemple Alias pour également connu sous le nom, BTW par le chemin. 5. Parfois, les abréviations et acronymes comprennent ponctuations et parfois non. Par exemple I. B.M. au lieu d'IBM, USA au lieu de U. S.A. 6. L'utilisation des apostrophes dans un langage informel pour la contraction (6). Par exemple, avoir non pour avoir pas, ne sera pas pour ne sera pas, etc. 5. LA TECHNIQUE T12 Le système de saisie de texte T12 dépend d'une certaine quantité de «pré-connaissance» sous la forme d'un dictionnaire amélioré, liste de mots avec la fréquence, et les informations de codage phonétique, ainsi que l'algorithme réel décrit ci-dessous. 5.1 Pre - Connaissance La technologie T12 utilise un dictionnaire et une liste de fréquence des mots pour créer une liste de mots finale avec l'aide d'un codage phonétique. Cette liste de mots final comprend les entrées nécessaires pour traduire les acronymes couramment utilisés sur la base de similitude phonétique. L'algorithme de T12, décrit dans Sec. 5.2, puis utilise la liste de mots finale. 5.1.1 dictionnaire T9 T12 utilise le même dictionnaire de base que le système de saisie T9 trouvés dans (1), étendu avec les formes courtes couramment utilisés dans diverses applications Internet telles que le chat et le courrier électronique. Le tableau 1 montre certains de ceux couramment utilisés qui seront utilisés pour créer la liste de mots finale. Tableau 1: Exemple de dictionnaire T9 Shorthand Phrase 2Day ASAP @ Aujourd'hui Dès que possible A 5.1.2 Liste des mots avec la fréquence Une liste de mots avec des informations de fréquence, généralement recueillies de l'analyse de corpus, est utilisé pour trier les suggestions pour faire du vélo à travers les choix en utilisant la touche Suivant. Pour notre application, nous avons utilisé celle trouvée dans (7). Le tableau 2 présente une liste de mots d'échantillon avec des informations de fréquence. Tableau 2: Exemple de liste de mots avec la fréquence Parole Fréquence Aujourd'hui Années d'Orange 263 902 14 5.1.3 Phonetic Encodage Phonetic Encodage code mots en fonction de leur prononciation. Parmi les nombreux codages phonétiques utilisés pour l'anglais, nous avons trouvé l'encodage Metaphone, Philips (8), pour être le plus approprié pour T12. Metaphone partitionne l'alphabet anglais à 16 consonnes: B X S K J T F H L M N P R Ø W Y Le code Ø représente le son. Metaphone utilise les règles de transformation suivantes dans son codage: Doublement lettres sauf goutte 2ème lettre. Voyelles ne sont conservés quand ils sont la première lettre. B - silencieux si pas suivi par une voyelle Exceptions aux lettres initiales kn - initiale, pn GN-, wh - initiale x - initiale ac - ou WR - Y si elle est suivie d'une voyelle S - 5.1.4 Normalisation Les mots d'entrée sont normalisées pour les convertir en une forme de base. Par exemple, 4 est converti en quatre, le plus tôt possible pour le plus tôt possible, IBM à IBM, Burger à hamburger (conversion en minuscules), etc. Normalization Algorithme si dans le raccourci du dictionnaire T9 (tableau 1), puis le convertir en phrase // dès que possible pour le plus tôt possible s'il y a des chiffres, puis le convertir en chiffres // 4mula à la formule si la ponctuation puis exclure les ponctuations // IBM à IBM convertir tout en minuscules // Burger à hamburger Nous générons une table avec des mots, normaliser la liste, et de créer le codage metaphone correspondant. Le tableau 3 montre le résultat de cette étape. Tableau 3: Exemple de mot, forme normalisée de ce mot et son encodage Parole mot Normalized Metaphone Metaphone encodage Qu'est ce que les fourmula WT Kat kat KT dès que possible dès que possible FRML SSNSPSBL 5.1.5 approximatifs algorithmes chaîne correspondants One la liste de mots est normalisée et les codages de Metaphone correspondantes sont calculées, nous utilisons deux algorithmes approximatifs chaîne d'appariement différentes pour créer la liste des suggestions que l'utilisateur peut faire défiler. Les deux algorithmes sont ED (Edit Distance) (9) et LCS (Longest Common Subsequence) (10). La distance d'édition (ED) donne le nombre d'insertion, la suppression, la transposition, et les opérations de substitution nécessaires pour convertir un mot à un autre mot. Notre algorithme convertit ce nombre d'opérations à un score dans l'intervalle [0.0,1.0] par la formule suivante: EDscr = (maxLen (s1, s2) - El) / maxLen (s1, s2); où s1 et s2 sont deux chaînes et ED est la distance d'édition entre ces deux mots. Par exemple, ED entre le crabe et le rab est de 1,0 et EDscr est de 0,75. The Longest Common Subsequence (LCS) est la longueur de la plus longue séquence commune des deux chaînes. Notre algorithme convertit cette longueur à un certain nombre dans l'intervalle [0.0,1.0] par la formule suivante. LCSscr = LCS / minLen (S1, S2); où s1 et s2 sont deux chaînes et LCS est la longueur de la plus longue séquence commune entre les deux mots. Par exemple, LCS entre crabe et rab est 3 et LCSscr est de 1,0. 5.1.6 wordlist final Le wordlist final est ensuite créé à partir de l'union du dictionnaire de base, et les mots dans les tableaux 1 et 2. Le tableau 4 montre un extrait de la liste de mots finale. Tableau 4: Wordlist Parole Aujourd'hui Années d'Orange 2Day ASAP @ Aujourd'hui Dès que possible A 5.2 T12 Algorithme Prétraitement: 1. Générer Tableau 1: T9 dictionnaire avec sténographie et la phrase colonnes. 2. Générer Tableau 2: liste de mots avec la fréquence avec mot et la fréquence des colonnes. 3. Générer Tableau 3: mot avec la forme normalisée de ce mot et ses colonnes de codage Metaphone. Traitement: 1. Récupère le mot d'entrée. 2. Obtenir chaîne normalisée du mot récupérées en utilisant l'algorithme de Sec. 5.1.4. 3. Obtenir Metaphone encodage de mot normalisé en utilisant le codage à la Sec. 5.1.3. 4. Trouver l'ensemble des mots qui ont le même encodage Metaphone que le mot d'entrée. 5. Pour chaque mot avec le même encodage, générer ED et LCS scores avec le mot d'entrée et avec la forme normalisée de ce mot. 6. A partir de ces deux valeurs prennent les ED et LCS notes maximales pour chaque mot. 7. Gardez seulement les mots qui sont au-dessus d'un certain seuil. 8. Rang les suggestions en fonction de la valeur moyenne des scores ED et LCS. 9. S'il y a deux mots avec le même score puis utilisez la fréquence du tableau 2 pour les classer. 5.3 Exemple de T12 Dans cette section, nous fournissons quelques exemples pour élaborer l'algorithme de T12 et de ses résultats. Dans les exemples ci-dessous, les numéros de séquence sont utilisées à partir des étapes de traitement de l'algorithme T12. Exemple 1: Supposons que le mot d'entrée est kat 1. mot = kat 2. mot normalisé = kat 3. Metaphone encoding = KT 4. mots avec l'encodage KT: a. kit b. agir c. d aiguë. cat e. f pris. couche g. Code h. couper i. l'équité j. porte k. Dieu l. bon m. obtenu n. o guider. p enfant. q quid. r calme. tout à fait s. citation 5. Décrit dans le tableau 5. 6. Décrit dans le tableau 5. Tableau 5: Exemple de ED et LCS pour mot d'entrée kat ED avec le mot kat ED avec le mot normalisé kat Max ED LCS avec le mot kat LCS avec le mot normalisé kat Max LCS moyenne kit Freq 0,66 0,66 0,66 0,66 0,66 0,66 0,66 9 agir 0,33 0,33 0,33 0,66 0,66 0,66 0,495 59 aiguë 0,2 0,2 0,2 0,66 0,66 0,66 0,43 23 cat 0,66 0,66 0,66 0,66 0,66 0,66 0,66 39 capturés 0,33 0,33 0,33 0,66 0,66 0,66 0,495 86 manteau 0,5 0,5 0,5 0,66 0,66 0,66 0,58 34 Code 0 0 0 0 0 0 0 52 coupé 0,33 0,33 0,33 0,33 0,33 0,33 0,33 29 capitaux propres 0,166 0,166 0,166 0,33 0,33 0,33 0,248 20 porte 0,5 0,5 0,5 0,66 0,66 0,66 0,58 35 dieu 0 0 0 0 0 0 0 36 bon 0 0 0 0 0 0 0 25 obtenu 0,33 0,33 0,33 0,33 0,33 0,33 0,33 932 Guide 0 0 0 0 0 0 0 12 kid 0,33 0,33 0,33 0,33 0,33 0,33 0,33 16 quid 0 0 0 0 0 0 0 13 calme 0,2 0,2 0,2 0,33 0,33 0,33 0,265 62 assez 0,2 0,2 0,2 0,33 0,33 0,33 0,265 412 devis 0,2 0,2 0,2 0,33 0,33 0,33 0,265 10 7. Nous supposons un seuil de 0,65, de sorte que les mots acceptés sont ceux avec des scores 0.65 sont: 1) kit 2) cat 7. Classé selon la moyenne des EDscr max et LCSscr valeurs maximales: 1) kit (0,66) 2) chat ( 0,66) 8. les deux ont la même valeur, alors classés en fonction de la fréquence: 1) chat (39) 2) kit (9) ainsi, avec la clé suivante #, quand nous défiler les choix, nous aurons notre première suggestion chat, puis kit pour le mot d'entrée kat. La séquence de touches pour le mot kat est 528. Le T9 par e Cycle avec cette séquence de touches produit la liste lat, lau, lav, jav, kat, kau et jau. Le cycle par T12, étant donné le seuil au-dessus, produit la liste de chat, et le kit. Exemple 2: Supposons que le mot d'entrée est gr8. 1. mot = gr8 2. mot normalisé = grand (car il se trouve dans le dictionnaire T9, par conséquent, dans le processus de normalisation, il sera converti en phrases correspondant) 3. Metaphone encoding = KRT 4. mots avec le KRT de codage: a. grd gr8 grande ED avec le mot GR8 0,5 1 0,4 ED avec le mot normalisé grande 0,4 0,4 1 Max ED 0,5 1 1 LCS avec mot GR8 0.66 1 0.66 LCS avec mot normalisé grande 0,5 0,66 1 Max LCS 0,66 1 1 Moyenne 0,58 1 1 Freq 9 9 9 carte accepté soigné tribunal porté créer foule pleuré qualité brute grid guard 7. Nous supposons un seuil de 0,65, de sorte que les mots acceptés avec des scores de 0,65: 1. gr8 2. grande 3. créer 8. Classé en fonction de la moyenne de EDscr et LCSscr valeurs maximales: 1. gr8 (1.0) 2. grande (1.0) 3. créer (0,73) 9. Tous les deux ont les mêmes valeurs, donc classés en fonction de la fréquence: 1. gr8 (9) 2. grande (9) 3. créer (82) Ainsi, avec la clé suivante #, lorsque nous faire défiler les choix, nous aurons la première suggestion que gr8 ou grande, et puis créer pour le mot d'entrée gr8. La séquence de touches pour le mot gr8 est 478. Le T9 par e Cycle avec cette séquence de touches produit la liste gru et Irv. Le cycle par T12, étant donné le seuil au-dessus, produit la liste grand et créer. Notre système d'entrée T12 proposé étend les capacités de T9 utilisant le soutien phonétique qui permet des fonctionnalités telles que la vérification de l'orthographe et l'élaboration de courts-formes en utilisant des mesures de similarité phonétique, tout en conservant la compatibilité ascendante avec T9. Par exemple, les mots d'entrée tels que kat, fone et ppl produisent le chat prévu, le téléphone et les personnes respectivement en utilisant le schéma de T12. T12 compresse également des messages, une caractéristique importante lors de l'examen des applications avec la taille des messages limités tels que les SMS, en permettant à l'utilisateur de faire défiler les choix et choisir les formes courtes. Par exemple, l'utilisateur peut choisir 2night pour ce soir, 4 pour pour, etc, le rétrécissement de la taille du message. Dans certains cas, il peut être nécessaire d'ajouter la forme courte du premier dictionnaire avant que l'utilisateur a le choix. Par exemple, pour être en mesure d'utiliser la forme courte msg pour le message, il est nécessaire d'ajouter msg au dictionnaire en utilisant les méthodes de Multitap standard. T12 effectue au moins aussi bien, et mieux que dans certains cas, que T9, en utilisant la combinaison de touches par mot métrique. Lorsque l'on considère la forme courte élaboration ou de la contraction, il est susceptible de faire mieux que T9. Le tableau 7 présente la performance relative en termes de frappes nécessaires pour un ensemble de mots couramment utilisés, montrant l'amélioration de la performance dans certains des cas. Tableau 7: Exemples de presse clé nécessaire dans T9 et T12 mot T9 13 appuyez sur la touche dès que possible appuyez sur 6 appuyer sur la touche 7 appuyer sur la touche 5 appuyer sur la touche 5 appuyer sur la touche 4 appuyer sur la touche 3 appuyer sur la touche T12 brb - #: 4 appuyer sur la touche dès que possible - #: 5 appuyer sur la touche be4 - #: 4 appuyez sur la touche msg - #: 4 appuyez sur la touche 2 jours - #: 5 appuyer sur la touche gr8 - #: 4 appuyer sur la touche lecture: 4 appuyez sur la touche pas: 3 appuyez sur la touche bientôt de retour 19 clé avant message aujourd'hui lu grand pas 7. CONCLUSION Nous proposons un nouveau système de saisie de texte l'ajoute aux capacités du système T9 populaire en utilisant la similitude phonétique pour détecter les erreurs d'orthographe, ainsi que d'élaborer des acronymes et des formes courtes couramment utilisés dans Internet applications. Les exemples ci-dessus illustrent nous espérons l'utilité du système de saisie de texte T12 pour les appareils mobiles clés en manque. Ce travail a été soutenu par l'Université BRAC. 1. t9 2. EST MacKenzie, H. Kober, D. Smith, T. Jones, et E. Skepner, LetterWise: désambiguïsation-Prefix pour la saisie de texte mobile, ACM Symposium sur le logiciel d'interface utilisateur et de la technologie, pp 111-120. (2001). 3. Longue définition de SMS, disponible en ligne à phonescoop / glossaire / terme? Gid = 132 4. W. Soukoreff et I. S. MacKenzie, 04). Valence, Espagne, IOS Press, (2004). 6. Détail de Apostrophe, disponible en ligne à uottawa. ca/academic/arts/writcent/hyper liste grammaire / apostrph 7. Word avec la fréquence, disponible en ligne à comp. lancs. ac. uk/ucrel/bncfreq/lists/1_2 _all_freq. txt 8. Lawrence metaphone algorithme de Philippe, disponible en ligne à aspell. sourceforge / metaphone / index 9. Levenshtein algorithme de distance d'édition, disponible en ligne à nist. gov/dads/HTML/Levenshtein. htm 10. TT Cormen, CE Leiserson et RL Rivest , introduction aux algorithmes, MIT Press, Cambridge, MA, 1990.
More
No comments:
Post a Comment