プログラミングの助け、質問への回答 / ルビー / Ruby：互換性のないエンコーディングの正規表現の一致-ruby

Ruby：互換性のないエンコードregexp match - ruby

Rubyが拒否しているという問題があります特定のラテン文字を含む文字列を分割します（おそらく他の文字に問題があるでしょう）。この特定のエラーに関する多くの投稿があることを知っていますが、答えはどれも私にとってはうまくいきませんでした。

問題を次の例に要約しました。問題を生成するスクリプトの全体を次に示します。スクリプト自体はutf-8にあります。

#!/usr/bin/ruby
str = "é"
arr = str.split(/x/sm)

2行目の文字はラテン語です急性の小さな電子。（はい、文字列には「x」が含まれていないため、実行する分割はあまりないことを知っています。これは単なるエラーを生成するための例です。）

エラーメッセージは次のとおりです。安全性と快適さのために折り返されています。

./dev.rb:3:in `split": incompatible encoding regexp match
(Windows-31J regexp with utf-8 string) (Encoding::CompatibilityError)
from ./dev.rb:3:in `<main>"

文字列を再エンコードして使用できませんでした。次のいずれの行も役に立たない：

str = str.force_encoding("iso-8859-1").encode("utf-8")

または

str = str.force_encoding(Encoding::UTF_8)

以下は、使用しているRubyのバージョンです。

ruby 2.3.1p112 (2016-04-26) [x86_64-linux-gnu]

どんな助けもありがとうございます。

回答：

回答№1は1

utf-8で正規表現をエンコードするだけです。

str = "é"
arr = str.split(/x/mu)
#=> ["é"]

ドキュメンテーション： https://ruby-doc.org/core-2.3.1/Regexp.html#class-Regexp-label-Encoding

Ruby 2.1のデフォルトの外部エンコーディング - ruby、encoding

Ruby：ここでは「正規表現のリテラル」という警告が表示されるのはなぜですか？ - ルビー

Rubyの正規表現は、ルビ、正規表現、パース

Ruby：終わりのないregexpがファイルの終わりを満たす - ruby

ルビーの正規表現オプション `n`にはどのような影響がありますか？ - ルビー、正規表現

Ruby Regexp：文字列の一部を単語に分割する方法 - ruby、regex

Twitter URLからツイートIDを抽出するこの正規表現を修正するにはどうすればよいですか？ - ルビー、正規表現

私は怒っているアプリに£記号を表示すると "互換性のない文字エンコーディング：CP850とutf-8"を受け取る - ruby、encode、ramaze

Ruby 2.4.1 stdin - rubyから特殊文字を読み取ることができません

Rubyで文字列から非UTF文字を削除しますか？ - ルビー、正規表現、文字列

なぜRubyはSymbol＃=〜（regex match operator）ではないのですか？ - ルビー

Ruby：条件ブロックで条件結果を使用する - ruby、regex

ruby：Regexp.union（配列）を使うときに境界線bオプションを追加する？ - ruby-on-rails、ruby、regex、ruby-on-rails-4

Ruby、Ruby、Ruby-on-Rails-3、エンコーディング、utf-8でUTF-8エラーをエンコードするRails

「互換性のない文字エンコード：utf-8とASCII-8BIT」を修正するにはどうすればよいですか？ - ruby-on-rails、ruby、encoding

'windows-1250' - ruby-on-rails、ruby、encoding、utf-8、rails-adminを使用しようとすると、Rails管理エンコーディングエラーが発生する

Ruby（正規表現を使用して）別の文字列内に文字列がありますか？ - ルビー・オン・レール、ルビー

Regexpはutf8文字の単語（w +）と一致しません[duplicate] - ruby-on-rails、ruby、regex

Rails：fb_connect_async_jsが500エラーを引き起こす - ruby-on-rails、ruby、encoding、facebooker2

Ruby：互換性のないエンコードregexp match - ruby

回答：

関連する質問