본문으로 바로가기

순위 검색

문제 설명

[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

  • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
  • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
  • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
  • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다. 예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다. 코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

  • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
  • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.


[문제]

지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때, 각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

  • info 배열의 크기는 1 이상 50,000 이하입니다.

  • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.

    • 개발언어는 cpp, java, python 중 하나입니다.
    • 직군은 backend, frontend 중 하나입니다.
    • 경력은 junior, senior 중 하나입니다.
    • 소울푸드는 chicken, pizza 중 하나입니다.
    • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
  • query 배열의 크기는 1 이상 100,000 이하입니다.

  • query의 각 문자열은 "[조건] X" 형식입니다.

    • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
    • 언어는 cpp, java, python, - 중 하나입니다.
    • 직군은 backend, frontend, - 중 하나입니다.
    • 경력은 junior, senior, - 중 하나입니다.
    • 소울푸드는 chicken, pizza, - 중 하나입니다.
    • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
    • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.

[입출력 예]
infoqueryresult
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"]["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"][1,1,1,1,2,4]
입출력 예에 대한 설명

지원자 정보를 표로 나타내면 다음과 같습니다.

언어직군경력소울 푸드점수
javabackendjuniorpizza150
pythonfrontendseniorchicken210
pythonfrontendseniorchicken150
cppbackendseniorpizza260
javabackendjuniorchicken80
pythonbackendseniorchicken50
  • "java and backend and junior and pizza 100" : java로 코딩테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 100점 이상 받은 지원자는 1명 입니다.
  • "python and frontend and senior and chicken 200" : python으로 코딩테스트를 봤으며, frontend 직군을 선택했고, senior 경력이면서 소울 푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 200점 이상 받은 지원자는 1명 입니다.
  • "cpp and - and senior and pizza 250" : cpp로 코딩테스트를 봤으며, senior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 250점 이상 받은 지원자는 1명 입니다.
  • "- and backend and senior and - 150" : backend 직군을 선택했고, senior 경력인 지원자 중 코딩테스트 점수를 150점 이상 받은 지원자는 1명 입니다.
  • "- and - and - and chicken 100" : 소울푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 100점 이상을 받은 지원자는 2명 입니다.
  • "- and - and - and - 150" : 코딩테스트 점수를 150점 이상 받은 지원자는 4명 입니다.

 

풀이

 

O(N^2)의 완전탐색으로 풀면 쉬운 문제입니다.

그러나 info배열의 최대크기 50000, query배열의 최대크기는 100,000이라 N^2로 풀면

효율성테스트에서 통과하지 못하게 됩니다.

 

이 때 이분탐색으로 푸는 문제구나 라고 떠올랐긴 했는데 데이터형을 저장할 자료구조를 어떤 것을

써야 하는지 가늠이 잘 안됐습니다.

 

info배열에 들어오는 값은 개발언어, 직군, 경력, 소울푸드, 점수

이렇게 있는데 이 정보들을 어떤 자료구조를 사용해서 매칭해야 하는지 감이 안왔습니다.

 

이는 HashMap으로 저장을 했습니다.

key는 String으로 두고 value를 리스트 타입으로 두었습니다.

key는 개발언어+직군+경력+소울푸드를 합친것이고 Map 자료구조 특성상 중복된 키가 들어오지 못하니

예를들어 입력이

 

java,backend,junior,pizza 100

java,backend,junior,pizza 200

 

이렇게 들어오는 경우 java,backend,junior,pizza를 key로 하고 동일한 키에 코딩테스트 점수를

리스트형으로 100,200 이렇게 넣어주는 것으로 일단 자료형을 설정했습니다.

 

그 다음으로 고려해줄 건 query에서 "-"에 해당하는 내용입니다.

이건 어떤것이든 상관없는 값인데 이걸 어떻게 접근할까 라는 생각이었습니다.

 

이것또한 map에 넣어주면 됩니다.

무슨소리냐 하면 예를들어서 info의 입력이 java,backend일 경우

java backend

java -

-backend

--

이렇게 각각의 경우의수를 만들어주면 됐습니다.

 

 

 

이 과정까지 거치면 일단 문제를 풀 준비가 다 됐습니다.

 

이제 이분탐색을 이용해서 풀어야하는데 이분탐색의 전재조건인 "정렬"이 돼 있는 상태를

만들어줘야 합니다.

 

점수를 기준으로 정렬하고 이분탐색을 진행하면 되는데 map자료구조의 정렬을 어떻게 하지

라는 생각이 있었습니다.

 

아래와 같이 하면 됐습니다.

map에 들어있는 key값을 map.KeySet()을 이용해서 받고

key에 해당하는 value를 어레이리스트에 대입합니다.

 

이 때 tmp와 map.get(key)가 가지고 있는 리스트는 같은 주소를 공유하므로

tmp만 정렬 해줘도 map.get(key)가 가지고 있는 리스트 또한 정렬이 됩니다.

 

 

점수를 기준으로 이분탐색의 기법중 하나인 lower_bound를 진행합니다

 

이렇게 하면 이분탐색이 끝나고 end의 값은 score의 값과 같거나 큰 원소중 첫번째 원소의 위치가 반환이 됩니다.

 

예를들어 리스트에 [10,50,70,90,100]이 있고 score가 55라고 하면

70이 있는 2가 반환이 됩니다(인덱스는 0부터 시작)

 

이때 score보다 높은 점수의 개수를 구하기 위해선

score값과 같거나 큰 값이 나오는 첫번쨰 위치로 나온 end값에서 리스트의 전체크기를 빼주면 됩니다.

 

실제 저 리스트의 크기는 5이고 end는 2이 나오게 되니

5-2 = 3이 나오게 됩니다.