/ / Existe-t-il une approche ou un format suggéré dans TraMineR pour les séquences de plus de 300 événements? - séquence, traminer

Existe-t-il un format ou une approche suggérée dans TraMineR pour les séquences de plus de 300 événements? - séquence, traminer

J'ai affaire à des séquences d'événements horodatéesqui ont plus de 300 événements. Ces données sont similaires aux journaux Web, où les utilisateurs consultent différentes pages d'un site Web à des moments différents. Une séquence peut être une session Web et chaque événement est une action de l'utilisateur (page de visite, clic, etc.).

J'ai d'abord utilisé le format TSE. En essayant de trouver des sous-séquences en utilisant seqefsub () TraMineR accroché. J'ai mis maxk = 5 et cela a fonctionné (cela limite la longueur des sous-séquences à rechercher à 5 événements). Cependant, max 6 ou plus se bloque également. Vous ne savez pas pourquoi cette baisse soudaine. En outre, lorsque j'ai élagué les séquences d'événements de manière à ne comporter que 15 événements, tout s'est bien déroulé. Il est donc clair que la longueur de la séquence d'événements est un problème.

Existe-t-il un format différent, plus robuste à la longueur de séquence, par ex. STS? Existe-t-il d'autres recommandations pour traiter des séquences de cette longueur dans TraMineR?

Réponses:

1 pour la réponse № 1

Le problème n'a rien à voir avec le format utilisé pour entrer les séquences.

TraMineR a seulement un algorithme rudimentaire pour rechercher des sous-séquences.

Je vous suggère de rechercher des outils plus appropriés à votre problème. Considérons par exemple le paquet R arulesSequences.