J'ai affaire à des séquences d'événements horodatéesqui ont plus de 300 événements. Ces données sont similaires aux journaux Web, où les utilisateurs consultent différentes pages d'un site Web à des moments différents. Une séquence peut être une session Web et chaque événement est une action de l'utilisateur (page de visite, clic, etc.).
J'ai d'abord utilisé le format TSE. En essayant de trouver des sous-séquences en utilisant seqefsub () TraMineR accroché. J'ai mis maxk = 5 et cela a fonctionné (cela limite la longueur des sous-séquences à rechercher à 5 événements). Cependant, max 6 ou plus se bloque également. Vous ne savez pas pourquoi cette baisse soudaine. En outre, lorsque j'ai élagué les séquences d'événements de manière à ne comporter que 15 événements, tout s'est bien déroulé. Il est donc clair que la longueur de la séquence d'événements est un problème.
Existe-t-il un format différent, plus robuste à la longueur de séquence, par ex. STS? Existe-t-il d'autres recommandations pour traiter des séquences de cette longueur dans TraMineR?
Réponses:
1 pour la réponse № 1Le problème n'a rien à voir avec le format utilisé pour entrer les séquences.
TraMineR
a seulement un algorithme rudimentaire pour rechercher des sous-séquences.
Je vous suggère de rechercher des outils plus appropriés à votre problème. Considérons par exemple le paquet R arulesSequences
.