Ajuda na programação, respostas a perguntas / r / Erro ao executar uma instrução if em R - r, processamento de texto

Erro ao executar uma instrução if em R - r, processamento de texto

Eu tenho essa pequena função para obter uma pontuação de Assonance para o texto

getAssonanceScore <- function(book, count) {
#for each sentence

for (i in length(book[[1]])){
words <- strsplit(book[i], "\ ")

for (j in length(words[[1]])){
if (substr(words[[1]][j],1,1) == substr(words[[1]][j+1],1,1) ) {
count <- count + 1
}

}

}

count <- count / length(book)

return (count)
}

O que isso faz é obter uma lista com uma linhade texto em sua primeira posição e uma segunda linha de texto em sua segunda posição e assim por diante. Depois de obter essa linha, ela divide a frase e a coloca em uma lista contendo todas as palavras constituintes. O que eu faço com isso é que eu comparo a primeira letra da primeira palavra com a primeira letra da segunda palavra, e a primeira letra da segunda palavra com a primeira letra da terceira para obter uma pontuação total de assonância. Isso é dividido pelo tamanho do livro. Quando tento testar esta função com uma pequena lista de entrada "word" do formulário:

> words
[1] "babbling brook by blue grass"

Isso me dá esse erro:

> Error in if (substr(words[[1]][j], 1, 1) == substr(words[[1]][j + 1],
> :    missing value where TRUE/FALSE needed

Eu estou trabalhando no RStudio, e muito iniciante no R, qualquer ajuda seria muito apreciada. Obrigado!

EDIT: Deve ser getAlliterationScore em vez de getAssonanceScore: D

Respostas:

3 para resposta № 1

for j in length(words[[1]]) não faz o que você espera; j é sempre igual ao tamanho total da lista. Isso também significa que j + 1 sai do final da lista (de modo que words[[1]][j + 1] retorna NA).

Mude o seu for linha de loop para

        for (j in seq_len(length(words[[1]]) - 1)) {

Agora

getAssonanceScore("babbling brook by blue grass", 0)

retorna 3.

Como observado nos comentários, uma abordagem melhor, computacionalmente mais eficiente e mais concisa seria

all_words <- unlist(strsplit(book, " "))
count <- sum(substr(head(all_words, -1), 1, 1) ==
substr(tail(all_words, -1), 1, 1))

Perguntas relacionadas

Erro de sintaxe na instrução UPDATE vb 2010 - vb.net

Manipulação de erro de mesclagem TSQL - tsql, tratamento de erros, mesclagem

SQL “IF”, “BEGIN”, “END”, “END IF”? - sql

Instrução SQL Oracle selecione u '' de dual - sql, oracle, postgresql, unicode

Processamento em segundo plano de consultas SQL - sql-server, sql-server-2005

Instrução de nome de arquivo SAS para referenciar um local de armazenamento agregado - sas, nomes de arquivos

Regex para excluir certos tipos de erros do log [fechado] - regex, regex-negation

Como criar algo acontecer quando time = x - processing

Tem vários diretórios em processamento ao usar o processamento-ide? - processamento, estrutura do projeto, processamento-ide

Qual é o resultado da execução de uma instrução PDO contendo duas consultas SELECT? - php, mysql, pdo

PHP - Erro ao lidar com a consulta mysql - php, mysql, mysqli

Text Analytics Vs Processamento de Linguagem Natural Qual é a diferença? - nlp, stanford-nlp, uima

Como verificar se a violação de chave na frente será acionada antes de executar a consulta SQL? - banco de dados mysql, sql

Erro do MySQL: Você deve redefinir sua senha [duplicada] - mysql

Java mysql preparado declaração de atualização não está funcionando - java, jdbc, preparado-declaração

java.sql.SQLException: Operação não permitida após o ResultSet ser fechado [duplicado] - java, jdbc

ajax progress Indicator permanece em execução - javascript, jquery, ajax, busyindicator

System.Data.OleDb.OleDbException: Erro não especificado durante o processamento do cubo SSAS - c #, sql-server-2008, ssas, cube

Exibir valores de consulta em caixas de texto individuais - c #, asp.net, sql

O código para de executar no mNotificationManager.notify (,) - android, notificationmanager