-
#19 순위 검색Algorithm/문제풀이 2022. 2. 26. 15:30
<문제>
[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]
카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.
- 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
- 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
- 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
- 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.
인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.
- 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
- 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
- backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
- 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
- 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?
즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.
* [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.[제한사항]
- info 배열의 크기는 1 이상 50,000 이하입니다.
- info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
- 개발언어는 cpp, java, python 중 하나입니다.
- 직군은 backend, frontend 중 하나입니다.
- 경력은 junior, senior 중 하나입니다.
- 소울푸드는 chicken, pizza 중 하나입니다.
- 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
- 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
- query 배열의 크기는 1 이상 100,000 이하입니다.
- query의 각 문자열은 "[조건] X" 형식입니다.
- [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
- 언어는 cpp, java, python, - 중 하나입니다.
- 직군은 backend, frontend, - 중 하나입니다.
- 경력은 junior, senior, - 중 하나입니다.
- 소울푸드는 chicken, pizza, - 중 하나입니다.
- '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
- X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
- 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
- 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.
[입출력 예]
info query result
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] ["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"] [1,1,1,1,2,4] 입출력 예에 대한 설명
지원자 정보를 표로 나타내면 다음과 같습니다.
언어 직군 경력 소울 푸드점수
java backend junior pizza 150 python frontend senior chicken 210 python frontend senior chicken 150 cpp backend senior pizza 260 java backend junior chicken 80 python backend senior chicken 50 - "java and backend and junior and pizza 100" : java로 코딩테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 100점 이상 받은 지원자는 1명 입니다.
- "python and frontend and senior and chicken 200" : python으로 코딩테스트를 봤으며, frontend 직군을 선택했고, senior 경력이면서 소울 푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 200점 이상 받은 지원자는 1명 입니다.
- "cpp and - and senior and pizza 250" : cpp로 코딩테스트를 봤으며, senior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 250점 이상 받은 지원자는 1명 입니다.
- "- and backend and senior and - 150" : backend 직군을 선택했고, senior 경력인 지원자 중 코딩테스트 점수를 150점 이상 받은 지원자는 1명 입니다.
- "- and - and - and chicken 100" : 소울푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 100점 이상을 받은 지원자는 2명 입니다.
- "- and - and - and - 150" : 코딩테스트 점수를 150점 이상 받은 지원자는 4명 입니다.
<풀이>
정확성 풀이는 어렵지않게 풀었지만, 효율성 풀이에서 시간이 많이 소요됐다. 처음 접해보는 유형이라 쉽지 않아 검색을 통해 힌트를 얻고 풀이했다.
얻은 힌트는, 하나의 정보에서 얻어 낼 수 있는 경우의 수를 데이터로 남겨놓고, 그 데이터를 키 값으로 갖는 딕셔너리에 value로 점수를 입력하여 저장해 놓는다. 저장해 놓은 딕셔너리에서 키값은 query이기 때문에 query 리스트에 하나의 값으로 검색하고, query 점수 값 이상인 값을 찾으면 된다.
여기서 딕셔너리를 선언 할 때 defaultdict(list)로 선언하였고, 점수를 검색할 때 이진탐색을 사용하기 위해 bisect_left를 사용했다.
defaultdict()는 인자로 주어진 객체의 기본값을 딕셔너리의 초깃값으로 선언할 수 있다.
만약 defaultdict(int)로 선언했다면 딕셔너리는 defaultdict(<class 'int'>, {}) 로 나타나며 다음과 같이 dict[key1] = 0 형식으로 접근 할 수 있다.
즉 defaultdict(list)는 defaultdict(<class 'list'>, {})로 나타나고, dict[key1] = [1, 2, 3 ...] 형식으로 나타낼 수 있다.
또 bisect은 이진탐색을 쉽게 구현할 수 있는 함수이다. 이진탐색을 구현해보면 다음과 같은 코드로 나타난다.
nums = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] n = 5 l = 0 r = len(nums) - 1 result = 0 while l <= r: mid = (l + r) // 2 if nums[mid] >= n: result = mid r = mid - 1 else: l = mid + 1 print(result)
이진탐색은 쉽게 말해 정렬된 리스트의 중간 값을 접근하며 검색에 대한 범위를 줄여나가며 값을 탐색하는 방법이다. 이진탐색은 응용해야 하는 문제가 출제되기도 하니 알아 놓아야 한다.
이진탐색을 사용하는 문제가 나오면 위처럼 구현하지 않고, bisect 라이브러리를 사용하면 된다.
bisect는 또 bisect_left, bisect_right 두가지 존재하는데 아래와 같이 사용된다.
bisect_left(literable, value) : 왼쪽 인덱스를 구하기
bisect_right(literable, value) : 오른쪽 인덱스를 구하기
쉽게 생각하면 value이상인 인덱스를 찾을 때는 left, 초과인 인덱스를 찾을 때는 right를 사용한다.
[1,2,3,4] 에서 value가 2이면 left에선 2의 인덱스 1을 반환, right에서는 3의 인덱스 2를 반환한다.
서론이 길었다. 이제 코드를 보자.
def solution(infos, queries): answer = [] #list개체를 기본 값으로 갖는 딕셔너리 선언 dic = defaultdict(list) #각 info 가공하기 for info in infos: info = info.split() condition = info[:-1] score = int(info[-1]) #각 정보에서 "-"가 포함된 쿼리에 검색될 수 있는 정보로 변환 후 저장 #ex) java는 "-"과 "java"로 검색이 가능하기 때문에 java가 포함된 info, #"-"로 변환한 info 두가지를 저장한다. #각 정보는 4가지의 카테고리를 갖기 때문에 루프를 통해 경우의 수 설정 for i in range(5): #i 크기에 따라 조합 리스트 설정 #i = 0일때는 정보를 그대로 딕셔너리에 저장 case = list(combinations([0, 1, 2, 3], i)) for c in case: tmp = condition.copy() for idx in c: tmp[idx] = "-" key = ''.join(tmp) #변환한 info를 키 값으로 점수 딕셔너리에 저장 dic[key].append(score) #점수가 들어있는 리스트를 정렬 for value in dic.values(): value.sort() for i in range(len(queries)): #쿼리에서 정보, 점수 추출 lang, category, career, temp = queries[i].split(' and ') food, score = temp.split() con = lang + category + career + food count = 0 # 딕셔너리에 쿼리의 정보가 있으면 쿼리 점수 이상인 정보의 점수 갯수 count에 저장 if con in dic: scores = dic[con] idx = bisect_left(scores, int(score)) count = len(scores) - idx answer.append(count) return answer
정리
효율성 문제는 처음 접해보아서 쉽지 않았다. 여기서 효율성을 검색할 정보를 직접 가공하는 방법과, 이진탐색을 통해 효율성 문제를 해결했다.
다음에도 효율성 문제를 접한다면 이진탐색, 정보의 가공 두가지를 되새기며 해결해보겠다.
'Algorithm > 문제풀이' 카테고리의 다른 글
#21 01타일 (0) 2022.06.25 #20 후보키 (0) 2022.03.05 #18 튜플 (0) 2022.02.20 #17 수식 최대화 (0) 2022.02.18 #16 거리두기 확인하기 (0) 2022.02.17