[Algorithm 이론] DFS/BFS

2024-06-11

그래프 탐색하기 위한 대표적인 두 가지 알고리즘

탐색(search) : 많은 양의 데이터 중 원하는 데이터를 찾는 과정
- 대표적인 탐색 알고리즘이 DFS/BFS

[자료구조(Data structure)의 기초]

: 데이터를 표현하고 관리하고 처리하기 위한 구조

스택과 큐는 자료구조의 기초 개념으로 아래 두 핵심적인 함수로 구성
- 삽입(push) : 데이터를 삽입한다.
- 삭제(pop) : 데이터를 삭제한다.

1. 스택(Stack)

선입후출 or 후입선출 구조
- 먼저 들어간게 늦게 나온다.
- 예시: 박스 쌓기
  아래에서부터 위로 쌓고 아래 박스를 치우기 위해 위에 박스를 먼저 내려놔야 함
별도의 라이브러리 사용 X
- append()와 pop() 메서드 이용하면 됨

스택 예제

삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
stack.pop() 했을 때 어떤 것이 지워지는지 확인

stack = []

stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()         # 7 삭제
stack.append(1)
stack.append(4)
stack.pop()         # 4 삭제

print(stack)        # 최하단 원소부터 출력
print(stack[::-1])  # 최상단 원소부터 출력

[5, 2, 3, 1]
[1, 3, 2, 5]

2. 큐(Queue)

선입선출 구조
- 먼저 들어간게 먼저 나간다.
- 예시: 대기 줄
  놀이공원 줄 설 때, 먼저 온 사람이 먼저 들어감
- 따라서, 공정한 자료구조라고 비유
- collections 모듈에서 제공하는 deque 자료구조 활용
  - 데이터를 넣고 빼는 속도가 리스트 자료형에 비해 효율적

큐 예제

삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
queue.popleft() 했을 때 어떤 것이 지워지는지 확인

# 큐 구현을 위해 deque 라이브러리 사용
from collections import deque

queue = deque()

queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()  # 5 삭제
queue.append(1)
queue.append(4)
queue.popleft()  # 2 삭제

print(queue)     # 먼저 들어온 순서대로 출력
queue.reverse()  # 역순으로 바꾸기
print(queue)

deque([3, 7, 1, 4])
deque([4, 1, 7, 3])

3. 재귀함수(Recursive function)

자기 자신을 다시 호출하는 함수
재귀 함수의 종료 조건
- 재귀 함수를 사용할 때 종료 조건을 꼭 명시
- if문이 대표적
내부적으로 스택 자료구조와 동일
- 스택 자료구조를 활용해야하는 상당수 알고리즘은 재귀함수를 이용하면 간편하게 구현
재귀함수 사용 시 코드가 간결해 진다.

(재귀함수 예제)

반복적으로 구현한 방식과 재귀적으로 구현한 두 방식을 비교
반복문 대신 재귀함수 사용 시 코드가 더 간결
종료 조건 : if $n<=1$이면 return하여 함수 종료
- $n * factorial_recursive(n-1)$에서 $n-1$ 때문에 $n$ 값은 계속 작아지게 됨

# 1. 반복적으로 구현한 n!
def factorial_iterative(n):
    result = 1

    for i in range(1, n+1):
        result *= i
        
    return result

# 2. 재귀적으로 구현한 n!
def factorial_recursive(n):
    if n <= 1:
        return 1
    
    return n * factorial_recursive(n-1)

print(f'반복적으로 구현: {factorial_iterative(5)}')
print(f'재귀적으로 구현: {factorial_recursive(5)}')

반복적으로 구현: 120
재귀적으로 구현: 120

스택과 큐 사용 시 주의사항!

삽입과 삭제 외에 ‘오버플로’ 와 ‘언더플로’ 고민
- 오버플로: 특정 자료구조가 수용할 수 있는 데이터의 크기를 이미 가득찬 상태에서
  삽입 연산 수행할 때 발생
- 언더플로: 자료구조에 데이터가 전혀 들어 있지 않은 상태에서 삭제 연산을 수행할 때 발생

[DFS(Depth-Fisrt Search)]

깊이 우선 탐색
- 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘
- 특정 경로로 탐색하다가 특정 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후,
  다시 돌아가 다른 경로로 탐색

그래프의 기본 구조

간선노드-removebg-preview

노드(node, =정점(vertex)) & 간선(Edge)
그래프 탐색 : 하나의 노드를 시작으로 다수의 노드를 방문하는 것
두 노드가 간선으로 연결 = 두 노드는 인접하다

그래프 표현방식 (2가지)

간선노드_2-removebg-preview

위와 같은 그래프가 있다고 가정.

1. 인접 행렬 : 2차원 배열로 그래프의 연결 관계를 표현하는 방식

인접행렬

2차원 배열에 각 노드가 연결된 형태
파이썬에서 2차원 리스트로 구현
인접하지 않는 노드 -> 논리적으로 정답이 될 수 없는 값으로 초기화
모든 관계를 저장 -> 노드 개수가 많을수록 메모리 효율 BAD
BUT, 정보를 얻는 속도는 빠름

(인접행렬 방식 예제)

인접행렬은 2차원 배열로 그래프 연결 관계를 나타난다했음

INF = 9999999 # 무한의 비용 선언

# 2차원 리스트를 이용해 인접 행렬 표현
graph = [
    [0, 7, 5],
    [7, 0, INF],
    [5, INF, 0]
]
print(graph)

[[0, 7, 5], [7, 0, 9999999], [5, 9999999, 0]]

2. 인접 리스트 : 리스트로 그래프의 연결 관계를 표현하는 방식

인접리스트-removebg-preview

모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장
2차원 리스트 이용
연결된 정보만 저장 -> 메모리 효율 GOOD!
BUT, 정보 얻는 속도 느림

(인접 리스트 예제)

모든 노드에 연결된 정보를 차례대로 연결 저장

# 노드 개수만큼 생성
graph = [[] for _ in range(3)]

# 노드 0에 연결된 노드 정보 저장 - '(노드, 거리)' 형태
graph[0].append((1, 7)) # 0과 1인 노드가 인접해 있고 거리는 7이다
graph[0].append((2, 5)) # 0과 2인 노드가 인접해 있고 거리는 5이다

# 노드 1에 연결된 노드 정보 저장
graph[1].append((0, 7)) # 1과 0인 노드가 인접해 있고 거리는 7이다

# 노드 1에 연결된 노드 정보 저장
graph[2].append((0, 5)) # 2과 0인 노드가 인접해 있고 거리는 5이다

print(graph)

[[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]

DFS 구체적인 동작 과정

탐색 시작 노드를 스택에 삽입하고 방문 처리
다음 과정을 반복
- 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면
  - 그 인접 노드를 스택에 넣고 방문 처리
- 스택의 최상단 노드에 방문하지 않은 인접 노드가 없으면
  - 스택에서 최상단 노드를 꺼냄(버림)
2번 과정을 더 이상 수행할 수 없을 때까지 반복

Tip!!

스택 자료 구조 이용
방문처리는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것
- 이를 통해, 각 노드를 한 번씩만 처리
코테에서 번호가 낮은 순서부터 처리하도록 명시하는 경우 종종 있기에 관행적으로
낮은 순서부터 처리하도록 구현
DFS 문제는 재귀 함수를 이용했을 때 매우 간결하게 구현 가능
O(N)의 시간 소요

(DFS 예제)

# v: 현재 내가 위치한 노드 번호
def dfs(graph, v, visited):
    # 현재 노드 방문 처리
    visited[v] = True
    print(v, end = ' ') # 현재 내가 있는 곳 출력(중복안됨.)

    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:           # visited[i]가 False 인 경우 = 방문 하지 않은 노드 일 경우
            dfs(graph, i, visited)

# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원)
graph = [
    [],
    [2, 3, 8], # 노드 1과 인접한 노드 번호
    [1, 7],    # 노드 2와 인접한 노드 번호
    [1, 4, 5], # 노드 3과 인접한 노드 번호
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현
# 9는 노드 개수(1~8까지 있는데 계산할때 헷갈리지 않으려고 0번째 노드는 비워둠)
visited = [False]*9    # 처음에는 아무것도 방문하지 않은 상태로 시작
                       

# 정의된 함수 호출
# 이러한 graph 가 들어갔을때 노드 1부터 시작할 것이고 처음에는 아무것도 방문하지 않은 상태로 시작할 것이다.
dfs(graph, 1, visited)

1 2 7 6 8 3 4 5

[BFS(Breadth-Fisrt Search)]

가까운 노드부터 탐색
큐 자료구조 이용(선입선출)

BFS 구체적인 동작 방식

탐색 시작 노드를 큐에 삽입하고 방문처리
큐에서 노드를 꺼내 해당 노드의 인접 노드 중 방문하지 않은 노드 모두 큐에 삽입
2번 과정 더 이상 수행할 수 없을 때까지 반복

Tip!!

큐 자료구조 이용
deque 라이브러리 사용
- import collections from deque
O(N)의 시간 소요
일반적으로 DFS보다 시간 효율성 높음

(BFS 예제)

# 라이브러리 불러오기 - BFS는 뭐다? queue 구조를 이용한다~
from collections import deque 

# graph : 노드가 연결된 정보
# start : 시작 위치
# visited : 방문했는지 안했는지 체크하기 위한 리스
def bfs(graph, start, visited):
    # 큐 구현을 위해 deque 라이브러리 사용
    queue = deque([start])

    # 현재 노드 방문 처리
    visited[start] = True

    while queue:
        v = queue.popleft()     # 방문한 곳은 큐에서 빼기
        print(v, end = ' ')     # 방문한 곳 출력
        for i in graph[v]:
            if not visited[i]:
                queue.append(i)
                visited[i] = True


# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원)
graph = [
    [],
    [2, 3, 8], # 노드 1과 인접한 노드 번호
    [1, 7],    # 노드 2와 인접한 노드 번호
    [1, 4, 5], # 노드 3과 인접한 노드 번호
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현
# 9는 노드 개수(1~8까지 있는데 계산할때 헷갈리지 않으려고 0번째 노드는 비워둠)
visited = [False]*9    # 처음에는 아무것도 방문하지 않은 상태로 시작

# 정의된 함수 호출
bfs(graph, 1, visited) 

1 2 3 8 7 4 5 6

요약 정리!

	DFS	BFS
동작원리	스택	큐
구현방법	재귀 함수 이용	큐 자료구조 이용

[자료구조(Data structure)의 기초]

1. 스택(Stack)

스택 예제

2. 큐(Queue)

큐 예제

3. 재귀함수(Recursive function)

(재귀함수 예제)

스택과 큐 사용 시 주의사항!

[DFS(Depth-Fisrt Search)]

그래프의 기본 구조

그래프 표현방식 (2가지)

1. 인접 행렬 : 2차원 배열로 그래프의 연결 관계를 표현하는 방식

(인접행렬 방식 예제)

2. 인접 리스트 : 리스트로 그래프의 연결 관계를 표현하는 방식

(인접 리스트 예제)

DFS 구체적인 동작 과정

Tip!!

(DFS 예제)

[BFS(Breadth-Fisrt Search)]

BFS 구체적인 동작 방식

Tip!!

(BFS 예제)

요약 정리!

댓글남기기