ケンオール通信第11号:括弧つきの町域(1) 括弧の内側と外側の分割

今回は、郵便番号データ内の括弧と括弧外の分割について紹介します。

データは、記載がない限り2021-05-31のデータを用いています。

ケンオールでどのようにパースされているかは、こちらのデモから試してみてください。

括弧つきの町域のパターン

郵便番号データの町域には、括弧つきのものが多数存在します。

0600042: 北海道 札幌市中央区 大通西(1~19丁目)

こうしたレコードは10,592件あります。 この大通西(1~19丁目)が町域にあたりますが、この構造は以下の5パターンに分かれます。

  • 町名 + 括弧(丁目、小字、番地など)
  • 町名 + ビル名 + 括弧(階層)
  • 町名 + 番地 + 括弧
  • 町名、町名 + 括弧
  • 町名 + 地割 + 括弧

この場合、括弧を除去すれば町名だけを取りだすことができます。

簡単なので、多くの郵便番号データパーサでは括弧を除去していますが、ケンオールでは括弧内の文字列もデータとして利用しています。

括弧内の処理についてはまた別の機会に説明します。

町名 + 括弧(丁目、小字、番地など)

1050022: 東京都 港区 海岸(1、2丁目)

ほとんどの括弧つきレコードはこのパターンに該当します。

ケンオールでは、丁目と小字は複数レコードに展開してkoazaフィールドとして保存し、番地の場合はそのまま削除しています。

展開すると、以下のようになります。

1050022: 東京都 港区 海岸 1丁目
1050022: 東京都 港区 海岸 2丁目

町名 + ビル名 + 括弧(階層)

1046001: 東京都 中央区 晴海 オフィスタワーX(1階)

単一のレコードだけでは町名とビル名の境界がわからないため、別のレコードを参照して町名を抽出し、それに基づいて文字列を分割する必要があります。 ケンオール通信第8号: ビル名の処理を参照してください。

町名 + 番地 + 括弧

このパターンは以下の2件しか存在しません。

4070311: 山梨県 北杜市 大泉町西井出8240-1(美森、たかね荘、清泉寮、サンメドウズスキー場)
8130008: 福岡県 糟屋郡粕屋町 内橋790の1(多ノ津団地)

ケンオールでは番地情報を原則保存しませんので、そのまま削除しています。

町名、町名 + 括弧

このパターンは香川県小豆郡土庄町にしか存在しません。 町名(この場合は大字)が読点で2つ併記されているパターンです。

7614103: 香川県 小豆郡土庄町 甲、乙(大木戸)

ケンオール通信第1号に記載の通り、土庄町郵便局様に確認したところ、小字は実質用いられてないとのことなので、小字(大木戸)を省略します。

町名 + 地割 + 括弧

括弧を含み、かつ町名の後に地割が登場するパターンです。

地割は、岩手県に存在する特殊な地名単位です。地割についてはケンオール通信第7号: 日本の住所の構造と郵便番号データを参照してください。

0240341: 岩手県 和賀郡西和賀町 杉名畑44地割(湯田ダム管理事務所、後口山、当楽)
0287915: 岩手県 九戸郡洋野町 種市第15地割~第21地割(鹿糠、小路合、緑町、大久保、高取)

地割の処理は別の機会に詳しく紹介しますが、地割は括弧内と括弧外のどちらにも登場するため、それぞれ別個に処理する必要があります。

第15地割~第21地割という範囲指定の場合、複数レコードに展開します。

0287915: 岩手県 九戸郡洋野町 種市
0287915: 岩手県 九戸郡洋野町 種市 第15地割
0287915: 岩手県 九戸郡洋野町 種市 第16地割
0287915: 岩手県 九戸郡洋野町 種市 第17地割
0287915: 岩手県 九戸郡洋野町 種市 第18地割
0287915: 岩手県 九戸郡洋野町 種市 第19地割
0287915: 岩手県 九戸郡洋野町 種市 第20地割
0287915: 岩手県 九戸郡洋野町 種市 第21地割

ケンオールでは、大字 + 地割 + 小字となった場合は原則として小字を省略するので、上記の例では括弧を省略しています。

ケンオールについて

「かゆいところにケンオール」

ケンオールは、郵便番号住所検索APIをはじめとした、システム開発を加速する高品質で安全なAPIサービスです。

サービスを試してみたい方はこちらから: kenall.jp

Shodoで執筆されました