学校コードに関する一考察
文科省から出ている学校コードですが、2021年末で確定になりました。
システム開発の立場からすると「全国の学校を短い桁数のデータで表現したい」場面があるので、考察をまとめてみました。
まず、全国の学校種と、都道府県別の学校数です。当然といいますか、幼稚園+保育園、小学校、中学校が一番多いです
これを地域別×学校種別にみると、ほぼ人口比になるのがわかるのですが、詳細は割愛します。
学校コードは「学校種」「都道府県番号」「設置区分」「学校番号」「検査数字」から成り立つ13桁の数字です。
学校コードの13桁はちょっと多くて、「じゃあ、学校番号なら一意になるのか」と思ってみると、地域をまたいで同じ番号があるよ、という例です。
そこで、じゃあ何桁あれば表現できるんだろう?と考えると、0-9A-Zから誤認率が高い0とO、1とLとIを除くなどしても4桁あれば表現できそうという話です。
この話を思いついたときに、「すごい!これで統一規格をつくればよい!」と思ったのですが、ある学習eポータルを展開しているサービスでも、学校を表現するコードが5桁くらいだったので、皆さんたどり着く先は一緒なんだろうな、と思いました。