開発期間:6ヶ月
人月:2人月
チーム構成
上司1名、担当1名
目的
行政書士がクライアントから受け取る書類の数・種類が膨大で管理しきれないという相談あり。
=>読み込むだけで管理ができるアプリケーション開発を実施し、管理工数を減らす。
コア処理フロー
pdf,image読込 => OCR => pre-process =>書類カテゴリ判定(RandomForestModel) => post-process => フロントエンド表示
実施内容
1.フロントエンド
・UI設計実施
・GithubからQtで作成された雛形を使用し、要所要所をスクラッチ
=>トグルスイッチやテキスト入力からpythonを動作させるPySideを使用しました。
2.バックエンド
・Pyside6を使用した環境構築を実施。
=>この時、客先がWindows、上司がMac、私がLinuxを使用していたためそれぞれで環境を用意する必要がありました。
・RandomForestModelを使用した書類分類機能の開発
=>基礎設計は上司が行い、教師データを変更しモデル作成を実施しました。
モデル改訂だけでなく、モデル前処理工程を踏まえることで分類成功率を800サンプル中で80% => 97%まで上げることができました。