TCP/IP 4계층 모델

 

 

들어가며


OSI 7계층, TCP/IP 4계층을 얕게만 알고있었는데 그림으로 공부하는 IT 인프라 구조라는 서적을 읽으며 정확히 이것들이 무엇인지 이해하게돼 정리겸 포스팅하고자 한다.

네트워크 전문가는 아니라서 너무 깊게할 필요는 없고 백엔드 개발자로써 필요한 범위까지만 알려주는것 같아 좋은 책인것 같다.

프로토콜이란?


프로토콜(Protocol)이라는 영어로는 사전에 정해 놓은 순서를 의미한다. 그리고 TCP/IP는 프로토콜의 한 종류다.

TCP/IP란?


TCP/IP 프로토콜은 명칭 그 대로 TCP와 IP의 두 가지 프로토콜을 주축으로 한 프로토콜 집합이다. 주축이라고 하지만 TCP와 IP라는 두 개의 프로토콜 외에도 다양한 프로토콜이 존재한다.

TCP/IP 탄생 배경


과거에는 네트워크 제조사별로 수 많은 독자 프로토콜을 사용하고 있어서 상호 접속에 문제가 있었다. 이런 이유로 국제 규격의 프로토콜을 만들 자는 움직임이 시작됐다. 이것이 1982년에 제정된 OSI라는 프로토콜이다. 하지만 이때 는 이미 1970년대에 고안된 TCP나 IP 프로토콜이 보급되고 있었으며, OSI 자체도 복잡한 사양 때문에 상호 접속성에 문제가 있었다. 국제 규격으로 OSI 사용을 권장했지만, 결국 OSI는 사장되고 말았다. 최종적으로는 TCP/IP를 이용하는 네트워크가 대다수가 됐고, TCP/IP가 인터넷의 사실상 표준이 된 것이다.

TCP/IP 4계층 모델


TCP/IP 탄생 배경에서 언급된 OSI 모델은 계층구조를 7계층으로 분할했지만, TCP/IP에서는 OSI 모델과 동일하게 7계층으로 분명하게 나누어지는 것은 아니다. TCP/IP 4계층 모델 등으로 불리며, OSI7계층의 1~2 계층을 모아서 링크 계층, 5~7계층을 모아서 애플리케이션 계층으로 취급하기도 한다. 3, 4계층은 그대로..

 

계층별 다른명칭

 

계층 명 Layer 명 비고
애플리케이션 계층 L7 L5 ~ 7을 모아 애플리케이션 계층으로 취급하기 때문에 TCP/IP 모델을 얘기할때 L5~6는 거의 등장하지 않는다.
전송 계층 L4  
IP(네트워크) 계층 L3  
데이터 링크(이더넷) 계층 L2 물리 & 데이터링크 계층을 통틀어 지칭함.

 

💡 특정 계층에서 그 계층이 담당한 처리가 끝나야 다음 계층으로 처리가 넘어가는 개념이 절대 아니고, 각 계층에서 담당&제공하는 기능이 다르고 다른 만큼 또 보여지는 관점 또한 다르기 때문에 계층으로 구분한것이다. (계층 구조를 이해할 때 가장 중요한것 같다.)


이제 각 계층에서 담당&제공하는 기능을 살펴보자.

L7 (애플리케이션 계층)과 HTTP 프로토콜

 

  • 애플리케이션 계층에서 사용하는 프로토콜은 HTTP가 있다.
  • 애플리케이션 계층은 소켓을 사용해 통신처리를 진행한다.
  • 애플리케이션 계층에서는 커널에다가 'TCP/IP로 통신하고 싶으니깐 상대방 애플리케이션과 통신할 수 이는 회선인 소켓을 열어줘!' 라고 의뢰한다. 이후 열려진 소켓에다 보낼 데이터만 기록하고 나머지 통신 처리는 모두 TCP/IP에게 위임한다.
  • 소켓을 열어달라고 의뢰할 때 커널에다가 IP주소와 TCP가 사용할 포트번호를 전달해주면 상대방 서버에도 소켓이열려 통신을 할수있는 가상경로가 생성된다.(실제는 물리적인 통신케이블을 통해 데이터가 전달된다.)

 

커널이란?
운영체제의 핵심부로 컴퓨터 자원들(CPU, 메모리, 파일, 네트워크, 입출력 장치 등)을 관리하는 역할을 한다.

 

 

L4 (전송계층)과 TCP 프로토콜

 

  • 전송계층에서 사용하는 프로토콜은 TCP가 있다.
  • 소켓에 기록된 애플리케이션 데이터는 커널 내에서 통신 대상에게 전달하기 위한 준비를 시작한다. 제일 먼저 임무를 수행하는 것이 전송 계층 프로토콜인 TCP다.

 

TCP란?

TCP(Transmission Control ProtocoI)는 명칭 그대로 전송을 제어하는 프로토콜로, 신뢰도가 높은 데이터 전송을 가능케 한다.

TCP의 역할을 간단히 말하면 ‘애플리케이션이 보낸 데이터를 그 형태 그대로 상대방에게 확실하게 전달하는 것이다. 단, 가능한 한 주변에는 민폐를 끼치지 않는다’라고 할 수 있다. 원래 신뢰도가 낮은 인터넷에서 사용하기 위해 만들어졌기 때문에 이런 역할이 주어졌다고할 수 있다.

TCP가 담당하는 것은 어디까지나 서버가 송신할 때와 서버가 수신한 후 애플리케이션 에게 전달할 때로, 상대 서버까지 전송하는 부분은 하위 계층인 IP에 모두 위임한다. 물론, TCP에 의존하지 않고 IP만으로도 통신할 수 있지만, IP에는 데이터가 상대방에게 확실히 전달됐는지 확인하는 기능이나 도착한 순서를 확인하는 기능 등이 없다.

TCP가 하는 기능은 많지만 중점적인 기능은 아래와 같다.

- 포트 번호를 이용해서 데이터 전송
- 연결 생성
- 데이터 순서 보증
- 데이터 손실 방지와 손실된 데이터 재전송
- 제어 흐름 제어와 폭주 제어

폭주제어란?

인터넷은 모두가 공유하는 것으로 공평성도 매우 중요하다.

통신이 자신만 생각해서 전속력으로 통신하면 도중에 있는 네트워크에서는 통신 흔잡이 발생해서 제대로 된 통신이 되지 않는다.

이 때문에 TCP 폭주 제어 기능에서는 다른 통신에게 가능한 한 민폐를 끼치지 않는 구조를 가지고 있다. 예를 들어, 통신 정체가 발생하면 TCP가 통신 속도를 자동으로내린다.

 

커널 공간의 TCP 흐름

 


소켓에 기록된 애플리케이션 데이터는 소켓의 큐를 경유해서 소켓 버퍼라 불리는 메모리 영역에서 처리된다. 소켓 버퍼는 소켓별로 준비된 전용 메모리 영역으로, 이후 계속되는 IP나 이더넷까지의 일련의 처리도 소켓 버퍼 내에서 이루어진다.

TCP는 애플리케이션 데이터에 TCP 헤더를 붙여서 TCP 세그먼트를 작성한다. 이 TCP 헤더에는 도착 지점 포트 번호를 포함해서 TCP 기능을 표현하기 위한 수 많은 정보가 기록된다.

하나의 TCP 세그먼트로 전송할 수 있는 최대 데이터 크기를 MSS(Maximum Segment Size) 라고 한다.

대부분의 환경에서 MSS는 1,460 바이트다.

 

포트 번호를 이용한 데이터 전송


상대 서버에 데이터가 도착했다고 해도 어떤 애플리케이션용 데이터인지 알 수 없다. TCP에서는 포트 번호를 사용해서 어떤 애플리케이션에 데이터를 전달할지 판단한다. TCP 포트 번호는 0~65535까지의 숫자를 이용한다.


앞서 설명했던 데이터를 전송하기 위해서는 일단 목적지와 연결(Connection)이 생성돼야 한다.
이 연결 생성은 어떻게 진행될까?

 

 

TCP의 연결(Connection) 생성

 

 

  1. 서버 프로세스는 통신을 위한 특정 포트를 열어둔다.(Listen)
  2. 클라이언트 프로세스는 연결을 생성하기위해 서버 프로세스가 listen하고있는 포트에 통신할 경로를 열어도 되는지 의뢰한다.
  3. 서버 프로세스는 클라이언트 프로세스에게 통신 경로를 열어도 된다는 응답을 준다.
  4. 클라이언트 프로세스는 서버 프로세스가 응답한 내용을 확인했다는 메시지를 다시한번 서버 프로세스에게 보낸다.
  5. 2~4 의 3-way handshaking 이 끝나면 통신할 수 있는 가상경로가 생성된다.

 

클라이언트 프로세스 측도 OS가 사용하지 않는 포트를 지정해서 3-way handshaking 에 사용한다. (?) 그림 6.17 에서는 42152


TCP는 어떻게 신뢰도 높은 데이터 전송을 제공할까?


데이터 손실 방지


ACK를 통해 TCP 세그먼트 데이터 손실을 방지 할 수있다.

수신 측에 TCP 세그먼트가 도착하면 수신 측은 송신 측에게 ACK로 도착했다는 것을 알린다. 이 ACK의 정보는 수신측이 응답시 TCP 세그먼트를 반환할 때 이 TCP 세그먼트에 붙어있는 TCP 헤더에 들어있다.

따라서 송신 측은 ACK가 돌아오는 것을 보고 전송한 TCP 세그먼트가 무사히 도착했다는 것을 알 수 있다. ACK가 오지 않으면 전송한 TCP 세그먼트가 어떤 이유로 사라졌을 가능성이 있다.

이 때문에 언제든지 재전송이 가능하도록 송신측에서 전송이 끝난 TCP 세그먼트라도 수신측으로부터 ACK가 돌아오기까지는 TCP 세그먼트는 소켓 버퍼에 남겨둘 필요가 있다.


데이터 순서 보증


TCP 헤더에 TCP 세그먼트 데이터를 표현하는 시퀀스 값을 부여해 데이터 순서를 보증할 수 있다.

TCP 세그먼트가 가지고 있는 데이터가 전송 데이터 전체 중 몇 바이트째부터 시작히는 부분인지를 표현한다. 예를 들어 3000바이트의 데이터를 보낼 때 1460바이트, 1460바이트, 80바이트의 세 가지 TCP 세그먼트로 분할했다고 하자.

첫 번째 세그먼트의 시퀀스 번호를 1, 두 번째를 1461, 세 번째를 2921 이라고 한다.

수신 측은 이 시퀀스 번호를 사용해서 원래 순서대로 데이터를 조립한다. (달리 말해 TCP 세그먼트들을 전송한 순서와 수신받은 순서가 같지 않아도 수신측은 조립이 가능하다.)

수신 측은 순차적으로 데이터를 조립하기 위해 ACK를 반환할 때 다음에 필요한 TCP 세그먼트의 시퀀스 번호도 ACK 내에 정보(ACK 번호)를 심어 송신측에 응답한다.

예를 들어, 3000바이트 전송시 두 번째 세그먼트까지 수신을 완료한 경우, 다음에 필요한 것은 세 번째 세그먼트이기 때문에 ‘다음 시퀀스 번호는 2921부터 보내(2920바이트까지의 데이터는 모두 도착했어)’라는 내용으로 2921이라는 ACK번호를 응답한다.


그림 6.18은 앞서 말했던 내용을 표현하며 추가로 데이터 손실시 데이터 재전송하는 내용도 포함한다.


손실된 데이터 재전송


그림 6.18에서 수신측은 세번째 TCP 세그먼트로 2921바이트 부터의 데이터를 요구했지만 수신받지 못했다. 수신측은 해당 TCP 세그먼트를 수신받을 때 까지 ACK번호를 2921로 가지는 TCP세그먼트를 응답해준다.

송신측은 ACK번호가 세번이나 중복되서 응답받았다면 이는 손실된데이터로 판단하고 재전송을 한다. (세번인 이유는 통신이 지연되서 늦게 도착할 수도 있기 때문에)

그리고 SACK(Selective ACK)라 불리는 옵션이 있다. 이는 ACK에 더 상세한 정보를 담아 응답할 수 있다. 2921을 수신받지 못해 ACK번호를 4831, 5841, 7301 대신 2921로 응답해주었지만 SACK을 통해 4831, 5841, 7301는 정상적으로 수신받았다고 이도 함께 송신측에 응답이 가능하다.

추가로 2921 말고도 예를들어 4381 데이터가 손실됐으면 2921을 수신받은 후 4381도 전달해라고 응답하는것으로 추측된다. (이는 나중에 필요할경우 더 깊게 공부해보자.)


비동기 전송

 


동기로 데이터를 통신하면 당연히 효율이 나쁘다. 그림 6.18을 다시 보면 송신측이 1461라는 ACK 번호를 응답 받기도 전에 1461 TCP 세그먼트를 전달하고있다. 이는 비동기로 TCP 세그먼트 전송이 가능하다는 얘기다.

TCP는 어느 정도의 세그먼트 수라면 ACK를 기다리지 않고 전송하는 윈도우라는 개념을 가지고 있으며, ACK를 기다리지 않고 전송 가능한 데이터 크기를 윈도우 크기라고 한다.

이 윈도우라는 개념은 나중에 필요한경우 더 깊게 공부하자..ㅎㅎ

L3(네트워크 계층)과 IP 프로토콜


TCP 세그먼트가 만들어지면 다음은 IP 처리가 시작된다.
IP의 역할을 간단히 말하자면, ‘지정한 대상 서버까지 전달받은 데이터를 전해 주는 것’ 이라 할 수 있다. 간단하지만 TCP/IP 중에서도 가장 중요한 기능이다. 단, IP에서는 반드시 전달된다고 보장하지 않는다. IP가 담당하는 기능은 중요하지만 종류는 그다지 많지 않다. 중요한 기능을 열거하면 다음과 같다.

  • IP 주소를 이용해서 초|종 목적지에 데이터 전송
  • 라우팅(Routing)

IP 계층에 전달된 TCP 세그먼트가 커널내에서 어떻게 처리되는지 살펴보도록 하자.


그림 6.20은 커널 내에서 이루어지는 IP 처리 흐름을 보여 준다. 생성된 TCP 세그먼트는 그대로 IP 처리에 돌입한다. IP 계층에서는 최종 목적지가 적힌 IP 헤더를 TCP 세그 먼트에 추가해서 IP 패킷을 생성한다.


헤더에는 목적지 IP주소 외에 저장하고 있는 데이터길이, 프로토콜 종류(TCP 등) 등이 기록된다.

이후 최종 목적지의 IP를 가지는 대상 서버까지 복수의 네트워크를 라우팅을 통해 경유해서 데이터를 전송한다. 복수의 네트워크란 말은 출발지 네트워크와 목적지 네트워크가 다르다는 뜻이다. (동일한 네트워크의 통신은 L2에서 설명)

L2(데이터 링크 계층)과 이더넷 프로토콜


IP 패킷이 만들어지면 계속해서 링크 계층의 처리가 시작된다. 링크 계층에서 사용되는 대표적인 프로토콜은 이더넷(Ethernet)이다. ‘대표적’이라고 말한 것은 이더넷 외에 다른 프로토콜이 몇가지 더 있기 때문이다. 예를들어, 무선랜프로토콜은 이더넷이 아니다. 이더넷은 유선랜이다.


이더넷 프로토콜의 역할


TCP/IP 4계층 모델에서 물리 계층과 링크계층은 링크계층(L2)으로 취급되듯이 링크계층의 이더넷 프로토콜은 물리계층과 밀접한 관계가 있다.

이더넷을 포함한 링크 계층 프로토콜의 역할을 간단히 말하자면, 동일 네트워크 내의 네트워크 장비까지만 전달받은 데이터를 운반한다고 할 수 있겠다.

동일한 네트워크까지만이란 뜻은 같은 스위치에 연결된 NIC끼리만 통신이 가능하다는 뜻이다.

링크계층에서는 IP 패킷에 이더넷 헤더이더넷 트레일러를 붙여 이더넷 프레임을 만든다.

이더넷 헤더에는 [목적지 MAC 주소 & 출발지 MAC 주소 & 이더넷유형] 가 들어간다.
이더넷 트레일러는 FCS(Frame Check Sequence)라고도 하는데, 데이터 전송 도중에 오류가 발생하는지 확인하는 용도로 사용한다.

MAC 주소 & NIC 란?

컴퓨터 안에는 랜카드라 불리는 NIC(Network Interface Card) 네트워크 장비가 있는데 이 장비에는 MAC(Media Access Control Address)가 전세계적으로 고유하게 할당되어있다.

추가로 랜카드 뿐만아니라 라우터 스위치 등 네트워크 장비라면 모두 MAC 주소가 부여된다.


L2에서 통신하는 과정을 살펴보자.


L2 통신과정

 

참조: https://itchallenger.tistory.com/m/217


AA-AA-AA-AA-AA-AA 출발지에서 이더넷 프레임을 NIC를 통해 스위치로 보내게되면

참조: https://itchallenger.tistory.com/m/217


스위치에는 MAC 주소 테이블이라는 표가 존재해 이더넷 헤더에 있는 목적지 MAC 주소를 참고해 해당 목적지 MAC 주소를 가지고있는 NIC를 찾아 이더넷 프레임을 전송하게 된다.

참조: https://itchallenger.tistory.com/m/217


그리고 데이터는 목적지 MAC 주소를 가지지않는 NIC에도 모두 전송되지만 목적지 MAC 주소가 자신의 MAC 주소와 다른경우 데이터를 파기 한다.

이후 수신측에서는 물리 계층에서 전기 신호로 전송된 데이터를 비트열로 변환하고 데이터 링크 계층에서 이더넷 헤더와 트레이러를 분리하여 역캡슐화를 하고 실제 데이터를 수신한다.

다시 말하지만 동일한 네트워크가아닌 다른 네트워크간 통신할경우에는 MAC 주소만으로 통신이 불가능하고 IP 프로토콜의 IP 주소 & L3 스위치 또는 라우터를 사용을 통해 가능하다. 이더넷은 동일 네트워크내에서만 데이터를 전송할 수 있는 기능만 제공한다.

L2와 L3 더 자세히

 


계층구조는 순차적인 처리로 계층을 나눈것이 아닌 계층별로 제공&담당하는 기능과 보이는 관점이 달라 나눈것이라고 얘기했다.

그림 6.29에서 (1) 과 (2)는 각 계층에서 보이는 범위 차이일뿐 L2관점에서 더 전체적인 통신과정을 더 자세하게 확인할 수 있다.

네트워크가 동일하다면 이더넷 프로토콜을 통해 MAC주소만 사용해서 통신이 가능하고 다른 네트워크라면 보내려는 데이터인 IP패킷을 L3 스위치 또는 라우팅에 전달해 다른 네트워트로 전달한다.

간단히 말하면 L2 스위치에서는 이더넷 헤더를 보고 목적지를 정하지만, L3 스위치나 라우터에서는 IP헤더 까지 확인해서 목적지를 결정한다.

참고로 IP 패킷은 그림 6.29에서 세 개의 네트워크(링크)를 경유하면서 네트워크 마다 각각 다른 이더넷 프레임에 저장돼서 전달된다.

그림 및 내용 참고


http://www.yes24.com/Product/Goods/95800974

 

그림으로 공부하는 IT 인프라 구조 - YES24

IT에 종사하는 사람이라면 반드시 읽어야 할 책!IT 인프라 전반에 대한 상식을 그림으로 쉽게 이해한다!이 책에는 다양한 환경에서 저자들이 직접 체득한 인프라 기술의 핵심을 포함해 아키텍처

www.yes24.com






'📡 Network' 카테고리의 다른 글

CIDR을 통해 알아보는 서브넷 마스크와 IP 클래스  (9) 2021.01.08