대기환경보전법 시행규칙 별표 8을 보면 대기오염배출허용기준에 대해 문서를 만들어놨다.
나름 형식을 갖추긴 했는데 찾아보기 시작하면 복잡하다. 파일을 인쇄해서 배출시설에 맞는지 일일히 조사해보는 게 기존의 방식이었다. 이 앱에서 시설명을 검색하면 즉시 해당 시설에 맞는 기준을 찾아주는 게 목표다.
일반적으로 오염물질을 우선하기 보다 본인 회사의 시설을 검색해보는 경우가 대부분이라고 생각한다.
예를들면 "보일러" 라고 검색했을 때 오염물질 중 보일러가 해당되는 물질들만 추려서 즉시 표시해준다면 일일히 찾아보는 수고를 줄일 수 있다. 물론 "보일러" 시설의 모든 리스트가 나오기 때문에 범위를 줄일 필요가 있다. 예를들면 "보일러 2024" 라고 검색하면 2024년도에 설치된 보일러가 해당하는 리스트만 나오게된다.
- PDF 파일의 내용을 json으로 만들 필요가 있다.
- json의 구조는 PDF의 구조와는 다르게 배출시설을 최상위로 두었다. 즉, 시설명 - 오염물질명 - 시설의스펙 - 농도 순이다.
AI에게 물어봐서 다음과 같은 답변을 얻었다.
- 검색 효율성: 사용자가 시설명으로 검색하는 경우가 많을 것으로 예상됩니다. 시설명을 최상위 키로 사용하면 검색 속도가 빨라집니다.
- 데이터 구조의 직관성: 각 시설별로 허용 기준을 그룹화하면 데이터 구조가 더 직관적이고 이해하기 쉬워집니다.
- 확장성: 추후 시설별로 추가 정보(예: 설치 연도, 위치 등)를 넣기 쉬운 구조입니다.
- 중복 최소화: 여러 시설에 동일한 오염물질 기준이 적용될 경우, 오염물질을 최상위로 두면 중복이 발생할 수 있습니다.
우선 파일의 모든 데이터를 json으로 옮겨 넣어야 하는데 손으로 하기에는 품이 많이 든다.. AI에게 시키려고 해도 토큰이 부족한지 일부의 정보만을 처리해줄 뿐이다.
간단한 웹서버
법이 갱신되면 갱신된 내용을 빠르게 반영할 수 있어야 한다
통합환경에도 적용되어야 한다