Pomoc w programowaniu, odpowiedzi na pytania / Scala / Problemy z separatorem linii w Scala StringLike - scala, Unicode

Problemy z separatorem linii w Scala StringLike - scala, unicode

Podczas pobierania danych, które są kopiowane i wklejane z przeglądarki HTML, czasami dostaję Unicode LINE SEPARATOR do mojej aplikacji:

u2028

http://www.fileformat.info/info/unicode/char/2028/index.htm

Tutaj jest w cudzysłowie: „”

Dzielę swoje dane wejściowe na wiersze z powodów, ale niestety nie są one odbierane przez StringLike.lines:

https://github.com/scala/scala/blob/2.11.x/src/library/scala/collection/immutable/StringLike.scala#L76

Czy ktoś wie, dlaczego?

Odpowiedzi:

0 dla odpowiedzi № 1

Wiersz kodu powiązany z pytaniem określa kryteria StringLike.lines używa do podziału linii:

private def isLineBreak(c: Char) = c == LF || c == FF

LL i FF są zdefiniowane jako:

private final val LF = 0x0A
private final val FF = 0x0C

Znak Unicode u2028 nie jest taki sam jak którykolwiek z nich. W tłumaczu Scala możemy to sprawdzić:

scala> val x = "u2028"

x: String = " "

scala> val LF = 0x0A
LF: Int = 10

scala> val FF = 0x0C
FF: Int = 12

scala> x == LF || x == FF
res0: Boolean = false

To jest powód, dla którego StringLike.lines nie przechwytuje podanego podziału linii Unicode.

Domyślam się, że to powód, dla którego Scalafunkcja jest zapisywana w ten sposób, tzn. dlaczego używa tylko tych podziałów linii ASCII (LF i FF), dlatego nie trzeba zakładać kodowania łańcucha znaków, tj. utf-8 vs. ISO-8859-1 itp.

Powiązane pytania

Co jest nie tak z moim scala.swing? - huśtawka, scala

kiedy ludzie mówią, że prowadzą "scala w backend", w jakim kontekście mogliby rozmawiać? - scala

Jak korzystać z węzłów scala? - scala

Problem z zaznaczeniem błędu za pomocą IntelliJ 10 CE z wtyczką scala - scala, intellij-idea

Używanie IntelliJ do projektu Scala - scala, intellij-idea

Scala Slick, Problem z włożeniem Unicode do bazy danych - scala, slick

Apache Spark SQL NumberFormatException - scala, apache-spark-sql

Wygeneruj skaladoc dla pakietu root - scala, dokumentacja, pakiety, scaladoc

Zestaw Scala - domyślne zachowanie - scala, set, scala-collections

jak przekonwertować charCode do odkodowania w scala - scala, unicode

Jak pogrupować pełen import w Scali? - scala, import

Czy pakiet scala.actors nie istnieje? - scala, actor, scala-2.10

Wyrażanie placu w Scala - scala

iskrzenie ze scala 2.10.4 do 2.11 - scala, wtyczka eclipse, apache-spark, apache-spark-sql

Czy mogę wygenerować wiązania Scala dla Objective-C i C ++ z scala-bindgen? - scala, wiążąca, scala-native, scala-bindgen

wykonanie skryptu scala w IDE - scala, scala-ide

Używanie API java.time w scala - scala

Dziwne zachowanie Set4 w scala 2.9.1? - scala, migracja, scala-2.8, scala-2.9

Czy program Scala może zostać skompilowany do pracy na dowolnej maszynie JVM bez zainstalowanego Scala na danym komputerze? - kompilator-konstrukcja, scala, jvm

Scala aktorzy na Androida - android, scala