ケンオール通信第11号:括弧つきの町域(1) 括弧の内側と外側の分割では、括弧を含む町域を持つ郵便番号レコードの処理の前半部分として、主に括弧外の住所処理について紹介しました。
今回は、括弧内の住所処理を紹介します。
データは、記載がない限り2021-11-30のデータを用いています。
前回までと元データのバージョンが違いますのでご注意ください。
処理結果を確認してみたい方はこちらのデモから試してみてください。
括弧内の住所処理の基本方針
ケンオールでは原則として「住所補完に役立つ情報を可能な限り保持する」という方針で住所を処理しています。
括弧内の情報で住所補完に役立つ情報とは、地方自治法第二百六十条における市町村の区域内の町若しくは字の区域
、つまり「丁目」や「小字」に該当する住所情報であるとケンオールでは考えています。
郵便番号データの住所構造についてはケンオール通信第7号: 日本の住所の構造と郵便番号データも参照してください。
上記に基づき、以下の方針で括弧内を処理します。
- 1レコードに複数の町域が含まれている場合は複数レコードに展開する
- 丁目・小字は可能な限り保持する
- 丁目と同等レベルの表現である「丁」「地割」も保持
- 番地情報は原則保持しない。理由は以下のとおり
- 番地を記載した郵便番号が少ない
- 番地の表記方法がバラバラ
- 実際にその番地が現存しているかなどの確認が難しい
- 一意に解釈するのが難しい
- 住所フォームが期待するフォーマットと異なる結果を表示する可能性が高い
- 既に利用されていないと思われる情報は保持しない
- 北海道の郵便番号レコードに含まれる「区」など
- 京都の通り名が記載されていた場合は専用のフィールドに情報を保持
丁目の処理
「丁目」は小字と同レベルとして処理しています。
9800065 宮城県 仙台市青葉区 土樋(1丁目「11を除く」)
展開すると以下のようになります。
9800065 宮城県 仙台市青葉区 土樋 1丁目
範囲指定
1~5丁目
のように範囲で指定されている場合は複数レコードに展開します。
2080032 東京都 武蔵村山市 三ツ木(1~5丁目)
展開すると以下のようになります。
2080032 東京都 武蔵村山市 三ツ木 1丁目 2080032 東京都 武蔵村山市 三ツ木 2丁目 2080032 東京都 武蔵村山市 三ツ木 3丁目 2080032 東京都 武蔵村山市 三ツ木 4丁目 2080032 東京都 武蔵村山市 三ツ木 5丁目
「丁目」と同列の住所単位(1) 「地割」
「地割」は、岩手県に存在する特殊な地名単位です。住所構造上は丁目と同レベルで存在します。 ケンオール通信第7号: 日本の住所の構造と郵便番号データも参照してください。
「丁目」の範囲指定は、○~×丁目
のように数字と数字の間だけで範囲指定を行い、住所単位「丁目」は最後に付与される方法で記述されていました。
一方、「地割」の範囲指定では第○地割~第×地割
と範囲の前後どちらにも単位が記載されています。
0285102 岩手県 岩手郡葛巻町 葛巻(第40地割「57番地125、176を除く」~第45地割)
展開すると以下のようになります。
0285102 岩手県 岩手郡葛巻町 葛巻 第40地割 0285102 岩手県 岩手郡葛巻町 葛巻 第41地割 0285102 岩手県 岩手郡葛巻町 葛巻 第42地割 0285102 岩手県 岩手郡葛巻町 葛巻 第43地割 0285102 岩手県 岩手郡葛巻町 葛巻 第44地割 0285102 岩手県 岩手郡葛巻町 葛巻 第45地割
かぎ括弧「」
の処理は次回紹介します。
「丁目」と同列の住所単位(2) 丁
「丁」は「丁目」と同様に処理します。
5900803 大阪府 堺市堺区 東上野芝町(1丁)
この「丁」は大阪府堺市特有の住所単位なのですが、面白い話があるのでこの記事の最後に紹介します。
番地や数字情報の処理
番地
「番地」は保存しないためそのまま削除します。
0882577 北海道 野付郡別海町 矢臼別(40の1番地、41の2番地)
単に削除するだけなので、町名のみが残されます。
0882577 北海道 野付郡別海町 矢臼別
区 (北海道の住所単位)
「区」は北海道で昔使われていた単位ですが、これも削除します。
詳細についてはケンオール通信第2回の北海道網走郡大空町東藻琴(北1区)を参照してください。
数字が併記されている場合
1、2、...
のように数字だけが羅列されている場合、先を読み進めていかないとその数字が「1丁目」なのか「1番地」なのか判別できません。
...、5丁目
のように初めて住所単位が登場したとき、文字列の前半に遡って住所単位を適用します。
丁目の併記
次の例では、複数の「丁目」が併記されています。
6660006 兵庫県 川西市 萩原台西(1、2丁目、3丁目1番~282番)
1、2丁目
は1丁目、2丁目
だと解釈します。
番地は削除するという方針のため、3丁目1番~282番
は、3丁目
と処理します。
展開すると以下のようになります。
6660006 兵庫県 川西市 萩原台西 1丁目 6660006 兵庫県 川西市 萩原台西 2丁目 6660006 兵庫県 川西市 萩原台西 3丁目
番地の併記
次の例では、数字が続いたあと最初に出てくる単位が「番地」のため、その前に出現する数字のみの表現は全て「番地」とみなして削除します。
0482331 北海道 余市郡仁木町 大江(2丁目651、662、668番地、3丁目103、118、210、254、267、372、444、469番地)
展開すると以下のようになります。
0482331 北海道 余市郡仁木町 大江 2丁目 0482331 北海道 余市郡仁木町 大江 3丁目
「丁」の単位と大阪府堺市
堺市のウェブサイトでは、この「丁」という住所単位の生まれた経緯について記されています。
1615年、大阪夏の陣で荒廃した堺の町は、碁盤の目状に整備された都市として再生しました。このとき、400以上の町が生まれたと言われています。明治5年に町名改正が行われ、「町」とされていた地域を「丁」と変えたのが由来とのことでした。
この明治5年は、大区小区制が施行された年です。 大区小区制はケンオール通信第2号でも少し紹介しましたが、字を使った地名が主体だった当時の日本の住所を一区、二区といった数字表現に置き換えることで行政の効率化を図ろうとした政策でした。
明治5年には他の大阪地域でも町名から丁目への移行が行われています。 例えば、大阪市中央区博労町は、明治5年3月17日に金澤町・金田町・茨木町・博労町から博労町一丁目~四丁目に変更されています。
この大阪エリアでは、大区小区制の施行にともない、丁目レベルでも数字化が行われていったのではないかと推測しています。 その中で現在の堺市(当時は堺県)は、歴史的事情により「丁」として数字化を行っていったのではないかと思われます。
このあたりは資料が見つかっていないため現在も調査中です。情報をお持ちの方は是非ご連絡ください。
次回予告
次回は括弧内の処理のうち、小字やかぎ括弧の処理について書く予定です。
ケンオールについて
「かゆいところにケンオール」 ケンオールは、郵便番号住所検索APIをはじめとした、システム開発を加速する高品質で安全なAPIサービスです。 サービスを試してみたい方はこちらから: kenall.jp
(Shodoで執筆されました)