문제
이중 우선순위 큐(dual priority queue)는 전형적인 우선순위 큐처럼 데이터를 삽입, 삭제할 수 있는 자료 구조이다. 전형적인 큐와의 차이점은 데이터를 삭제할 때 연산(operation) 명령에 따라 우선순위가 가장 높은 데이터 또는 가장 낮은 데이터 중 하나를 삭제하는 점이다. 이중 우선순위 큐를 위해선 두 가지 연산이 사용되는데, 하나는 데이터를 삽입하는 연산이고 다른 하나는 데이터를 삭제하는 연산이다. 데이터를 삭제하는 연산은 또 두 가지로 구분되는데 하나는 우선순위가 가장 높은 것을 삭제하기 위한 것이고 다른 하나는 우선순위가 가장 낮은 것을 삭제하기 위한 것이다.
정수만 저장하는 이중 우선순위 큐 Q가 있다고 가정하자. Q에 저장된 각 정수의 값 자체를 우선순위라고 간주하자.
Q에 적용될 일련의 연산이 주어질 때 이를 처리한 후 최종적으로 Q에 저장된 데이터 중 최댓값과 최솟값을 출력하는 프로그램을 작성하라.
입력
입력 데이터는 표준입력을 사용한다. 입력은 T개의 테스트 데이터로 구성된다. 입력의 첫 번째 줄에는 입력 데이터의 수를 나타내는 정수 T가 주어진다. 각 테스트 데이터의 첫째 줄에는 Q에 적용할 연산의 개수를 나타내는 정수 k (k ≤ 1,000,000)가 주어진다. 이어지는 k 줄 각각엔 연산을 나타내는 문자(‘D’ 또는 ‘I’)와 정수 n이 주어진다. ‘I n’은 정수 n을 Q에 삽입하는 연산을 의미한다. 동일한 정수가 삽입될 수 있음을 참고하기 바란다. ‘D 1’는 Q에서 최댓값을 삭제하는 연산을 의미하며, ‘D -1’는 Q 에서 최솟값을 삭제하는 연산을 의미한다. 최댓값(최솟값)을 삭제하는 연산에서 최댓값(최솟값)이 둘 이상인 경우, 하나만 삭제됨을 유념하기 바란다.
만약 Q가 비어있는데 적용할 연산이 ‘D’라면 이 연산은 무시해도 좋다. Q에 저장될 모든 정수는 -231 이상 231 미만인 정수이다.
출력
출력은 표준출력을 사용한다. 각 테스트 데이터에 대해, 모든 연산을 처리한 후 Q에 남아 있는 값 중 최댓값과 최솟값을 출력하라. 두 값은 한 줄에 출력하되 하나의 공백으로 구분하라. 만약 Q가 비어있다면 ‘EMPTY’를 출력하라.
내 풀이
import heapq
import sys
input = sys.stdin.readline
t = int(input())
for _ in range(t):
k = int(input())
minq, maxq = [], []
count = [False]*k
for i in range(k):
operator, x = input().strip().split()
x = int(x)
if operator == 'I':
heapq.heappush(minq, (x, i))
heapq.heappush(maxq, (-x, i))
count[i] = True
else: # operator == 'D'
if x == -1:
if len(minq) > 0:
val = heapq.heappop(minq)[1]
count[val] = False
else: # value == 1
if len(maxq) > 0:
val = heapq.heappop(maxq)[1]
count[val] = False
while minq and count[minq[0][1]] == False:
heapq.heappop(minq)
while maxq and count[maxq[0][1]] == False:
heapq.heappop(maxq)
if minq == []:
print("EMPTY")
else:
print(-maxq[0][0], minq[0][0])
시간 복잡도 →
k
는 연산의 회수 (heapppush
,heappop
)공간 복잡도 →
minq
,maxq
,count
사용
코멘트
우선순위 큐(파이썬에서 heapq
)에서 가장 큰 값을 꺼내는 방법은 값을 음수로 입력하는 것이다. 따라서 원래의 수를 그대로 넣는 minq
와 음수로 바꾸어서 값을 넣는 maxq
heap을 따로 만들어서 값을 입력한다. 이 때 입력받은 숫자값만 넣지 말고 (입력받은 숫자, 인덱스)
와 같은 형태로 입력한다. 인덱스와 같이 입력하는 이유는 이 값이 사용되었는지 구분하기 위해서이다. 그리고 count
라는 배열을 만들어서 해당 값이 사용되었는지를 표시해준다. count[인덱스] == True
면 값이 heappush
된 상태이고 False
여야 heappop
으로 꺼내진 것이다. 이 count 값을 이용해서 minq
와 maxq
에 두 번 입력된 값을 중복으로 사용되지 않고 최대값을 가장 먼저 꺼내거나 최소값을 먼저 꺼낼 수 있도록 구현할 수 있는 것이다.
이 문제도 이중 순위큐를 잘 구현하는 것 뿐만 아니라 다른 요소에도 자잘하게 신경쓰지 않으면 시간초과가 뜬다ㅠ input = sys.stdin.readline
를 사용하지 않았을 때에는 이중 순위 큐를 구현했음에도 시간초과가 떴다. sys.stdin.readline
을 사용하고 나서야 시간 초과없이 python3에서 정답을 받았다. (그 외에도 if len(minq) == 0:
→ if minq == []:
이라고도 고쳤으나 시간을 줄이는데 큰 영향은 없다는 듯...)