⚖️ 👩🏿‍🤝‍👩🏼 🗄️ Haskell iniファイル用のパーサーを作成する 🎠 🧑🏽‍🤝‍🧑🏽 🧑🏾

この記事では、Haskellでパーサーのiniファイルを作成する方法を説明します。前回の記事で構築した文脈自由文法を基礎として取り上げます。パーサーを構築するには、 Parsecライブラリを使用します。これにより、 パーサーコンビネーターを使用して既製のプリミティブパーサーを組み合わせて、独自のパーサーを構築できます。

重要：この記事は、読者がHaskellの基本に精通していることを前提としています。そうでない場合は、初心者向けの記事を最初に読むことをお勧めします（Habréを含む）。

文法

最初に、前の記事で作成したiniファイルの文法を思い出しましょう。

inidata = spaces, {section} .
section = "[", ident, "]", stringSpaces, "\n", {entry} .
entry = ident, stringSpaces, "=", stringSpaces, value, "\n", spaces .
ident = identChar, {identChar} .
identChar = letter | digit | "_" | "." | "," | ":" | "(" | ")" | "{" | "}" | "-" | "#" | "@" | "&" | "*" | "|" .
value = {not "\n"} .
stringSpaces = {" " | "\t"} .
spaces = {" " | "\t" | "\n" | "\r"} .

彼女の説明がすぐに必要です。

ハスケルとパーセク

Parsecをインストールすることから始めます（公式Webサイトで入手するか、OSの既製のパッケージを探してください）。異なるシステムのインストールプロセスは異なる場合があるため、ここでは説明しません。

Haskellでパーサーを作成するプロセスを詳細に説明しようとします。必要なモジュールを接続することから始めましょう。標準のシステム（パラメーターの受信用）、Data.Char（isSpace関数用）、およびData.List（find関数用）に加えて、Parsecモジュール-Text.ParserCombinators.Parsecを接続する必要があります。

1 module Main where
2
3 import System.Environment
4 import Data.Char
5 import Data.List
6 import Text.ParserCombinators.Parsec

データタイプを定義します。レコードはキーと値のペア、セクションはレコードのキーリスト、すべてのiniファイルデータはセクションのリストです。

8 type Entry = (String, String)
9 type Section = (String, [Entry])
10 type IniData = [Section]

ここで、文法をBackus-Naur表記からHaskellに転送します。 inidataから始めましょう。

12 inidata = spaces >> many section >>= return

ここで何が書かれているのかを説明します：inidataはスペース（これはプリミティブなParsecライブラリパーサー）で構成され、その後に（モナド演算子>>で示されます）値が返される（>> = return）多くのセクションが続きます。
値を返すとはどういう意味ですか？パーサーのタスクは、文法とデータの対応をチェックするだけでなく、データを何らかの構造形式に変換することでもあります。私たちの場合、これはIniDataデータ型です。 many関数は、非終端Aパーサーの{A}のパーサーを構築するパーサーコンビネーターです。

次に、非終端セクションをHaskellに翻訳します。セクションはinidataよりもはるかに複雑であるため、do-notationで記述します。

14 section = do
15 char '['
16 name <- ident
17 char ']'
18 stringSpaces
19 char ' \n '
20 spaces
21 el <- many entry
22 return (name, el)

このコードは、Backus-Naur表記法からの非終端セクションのほぼ文字通りの翻訳です。 char関数は、単一の文字を解析するプリミティブパーサーを作成します。 16行目、21行目、および22行目に注意する価値があります。16行目では、ident非終端記号（セクション名）の値を保存し、21行目ではセクション見出しに続くレコードのリストを保存します。 22行目では、読み取ったセクション名とレコードのリストを返します（これはセクションタイプに対応しています）。

レコードに移動します。

24 entry = do
25 k <- ident
26 stringSpaces
27 char '='
28 stringSpaces
29 v <- value
30 spaces
31 return (k, v)

セクション用のパーサーの作成方法を理解していれば、問題はないはずです。要するに、25行目と29行目では、パラメーター名とその値を保存し、それらで構成されるペアを返します（Entryタイプに対応）。

識別子の非終端記号を記述します。 Parsecには、identCharとidentの非終端記号を1つに結合できるmany1コンビネータがあるという事実を利用します（そのような指定がないため、Backus-Naur表記ではこれを行うことができませんでした）。

32 ident = many1 (letter <|> digit <|> oneOf "_.,:(){}-#@&*|" ) >>= return . trim

many1コンビネータは、識別子が少なくとも1文字で構成されることを意味します。演算子<|>は、文字「|」と一致しますバッカスナウア表記法。文字と数字は、それぞれ文字と数字のプリミティブパーサーです。文字列のoneOf関数は同等です（char '_' <|> char '。' <|> .....）。また、値が返されると、受信した文字列が切り捨てられることに注意してください（trim関数を使用）。

値の非終端に対しても同じことを行いますが、oneOfの逆のnoneOfパーサーを使用します。


34 value = many (noneOf " \n " ) >>= return . trim

最後の非終端文字であるstringSpacesが残ります（非終端文字はすでにParsecにあります）。

36 stringSpaces = many (char ' ' <|> char ' \t ' )

それはすべて文法です。いくつかの便利な機能と、もちろんメイン自体を定義することは残っています。

行の先頭と末尾の余分なスペースを削除するには、トリム関数が必要です。

38 trim = f . f
39 where f = reverse . dropWhile isSpace

split関数は、デリミタ区切り文字を使用してテキストを行に分割します。区切り文字自体は行末に残ります。

41 split delim = foldr f [[]]
42 where
43 f x rest @ (r : rs)
44 | x == delim = [delim] : rest
45 | otherwise = (x : r) : rs

removeComments関数は、コメントと空の行を削除します。テキストを行に分割し、「;」で始まる行を削除しますまたは「\ n」で、それらを再び接着します。

47 removeComments = foldr ( ++ ) [] . filter comment . split ' \n '
48 where comment [] = False
49 comment (x : _) = (x /= ';' ) && (x /= ' \n ' )

findValue関数は、セクションの名前とパラメーター名によってパラメーター値のIniDataを検索します（計算はMaybeモナドで行われます）。最初に名前でセクションを見つけ、次にセクションのレコードの中から目的のパラメーターを見つけます。ある時点で何も見つからない場合、関数は単にNothingを返します。

51 findValue ini s p = do
52 el <- find ( \ x -> fst x == s) ini
53 v <- find ( \ x -> fst x == p) (snd el)
54 return $ snd $ v

最後のステップ-メイン関数に進みます。

56 main = do
57 args <- getArgs
58 prog <- getProgName
59 if (length args) /= 3
60 then putStrLn $ "Usage: " ++ prog ++ " <file.ini> <section> <parameter>"
61 else do
62 file <- readFile $ head args
63 [s,p] <- return $ tail args
64 lns <- return ( removeComments file )
65 case (parse inidata "some text" lns) of
66 Left err -> putStr "Parse error: " >> print err
67 Right x -> case (findValue x s p) of
68 Just x -> putStrLn x
69 Nothing -> putStrLn "Can't find requested parameter"
70 return ()

すべてが古き良きCの57〜58行目と同じです。パラメーターとプログラム名を取得します。さらに、3つのパラメーターがない場合は、使用法を表示します。パラメーターがすべて問題ない場合は、ファイルを読み取り（62）、コメントを削除します（64）。
次に、パーサーを開始する必要があります。これを行うには、解析（65）関数があります。この関数には、メインの非端末、テキストの名前（エラーの表示に使用）、およびテキスト自体を渡す必要があります。解析関数は、エラーの説明（左、65）または受信データ（右、66）を返します。すべてが解析されると、受信したデータでセクションの名前とパラメーターの名前（67）でレコードを検索します。検索は、見つかった値（Just、68）を返してから表示するか、何も返さない（Nothing、69）か、エラーメッセージを表示します。

これで、コードは完全に作成されました。コンパイルして、テスト例で実行します。

$ ghc --make ini.hs -o ini_hs
[1 of 1] Compiling Main ( ini.hs, ini.o )
Linking ini_hs ...

$ ./ini_hs /usr/lib/firefox-3.0.5/application.ini App ID
{ec8030f7-c20a-464f-9b0e-13a3a9e97384}

$ ./ini_hs /usr/lib/firefox-3.0.5/application.ini App IDD
Can't find requested parameter

この記事が、独自のパーサーの作成に役立つことを願っています=）

興味深いメモ：この記事のパーサーを、記事「 C ++ でiniファイル用のパーサーを作成する」の C ++のパーサーと比較できます。

PS。この投稿をHaskellブログに投稿していただきありがとうございます。

Haskell iniファイル用のパーサーを作成する

文法

ハスケルとパーセク

More articles: