티스토리 뷰
Overview
터미널 명령어 중 텍스트 처리에 관련된 명령어를 정리합니다. 다양한 옵션이 존재하지만 실무에서 사용하는 것들 위주로 정리하였습니다.
sed
Description
stream editor의 약자로 파일 내용을 출력할 때 사용하는 스트림의 내용을 수정하는 명령어 입니다.
Options
- {RANGE}p: RANGE내의 라인을 출력
- {RANGE}d: RANGE내의 라인을 삭제
- /{PATTERN}/p: 패턴에 매칭되는 라인을 출력
- /{PATTERN}/d: 패턴에 매칭되는 라인을 삭제
- s /{REGEX}/{REPLACEMENT}: 정규표현식에 매칭되는 부분을 REPLACE로 대체
Examples
tail /etc/passwd | sed -n '1,5p'
> tail /etc/passwd | sed -n '1,5p'
_demod:*:275:275:Demo Daemon:/var/empty:/usr/bin/false
_rmd:*:277:277:Remote Management Daemon:/var/db/rmd:/usr/bin/false
_accessoryupdater:*:278:278:Accessory Update Daemon:/var/db/accessoryupdater:/usr/bin/false
_knowledgegraphd:*:279:279:Knowledge Graph Daemon:/var/db/knowledgegraphd:/usr/bin/false
_coreml:*:280:280:CoreML Services:/var/empty:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 1~5 번째 라인만 출력합니다.
tail /etc/passwd | sed '1,5d‘
> tail /etc/passwd | sed '1,5d'
_sntpd:*:281:281:SNTP Server Daemon:/var/empty:/usr/bin/false
_trustd:*:282:282:trustd:/var/empty:/usr/bin/false
_darwindaemon:*:284:284:Darwin Daemon:/var/db/darwindaemon:/usr/bin/false
_notification_proxy:*:285:285:Notification Proxy:/var/empty:/usr/bin/false
_oahd:*:441:441:OAH Daemon:/var/empty:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 1~5 번째 라인을 제외하고 출력합니다.
tail /etc/passwd | sed -n '/Daemon/p'
> tail /etc/passwd | sed -n '/Daemon/p'
_demod:*:275:275:Demo Daemon:/var/empty:/usr/bin/false
_rmd:*:277:277:Remote Management Daemon:/var/db/rmd:/usr/bin/false
_accessoryupdater:*:278:278:Accessory Update Daemon:/var/db/accessoryupdater:/usr/bin/false
_knowledgegraphd:*:279:279:Knowledge Graph Daemon:/var/db/knowledgegraphd:/usr/bin/false
_sntpd:*:281:281:SNTP Server Daemon:/var/empty:/usr/bin/false
_darwindaemon:*:284:284:Darwin Daemon:/var/db/darwindaemon:/usr/bin/false
_oahd:*:441:441:OAH Daemon:/var/empty:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 Daemon이 포함된 라인만 출력합니다.
tail /etc/passwd | sed '/empty/d'
> tail /etc/passwd | sed '/empty/d'
_rmd:*:277:277:Remote Management Daemon:/var/db/rmd:/usr/bin/false
_accessoryupdater:*:278:278:Accessory Update Daemon:/var/db/accessoryupdater:/usr/bin/false
_knowledgegraphd:*:279:279:Knowledge Graph Daemon:/var/db/knowledgegraphd:/usr/bin/false
_darwindaemon:*:284:284:Darwin Daemon:/var/db/darwindaemon:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 empty가 포함된 라인을 제외하고 출력합니다.
tail /etc/passwd | sed 's/:/=/'
> tail /etc/passwd | sed 's/:/=/'
_demod=*:275:275:Demo Daemon:/var/empty:/usr/bin/false
_rmd=*:277:277:Remote Management Daemon:/var/db/rmd:/usr/bin/false
_accessoryupdater=*:278:278:Accessory Update Daemon:/var/db/accessoryupdater:/usr/bin/false
_knowledgegraphd=*:279:279:Knowledge Graph Daemon:/var/db/knowledgegraphd:/usr/bin/false
_coreml=*:280:280:CoreML Services:/var/empty:/usr/bin/false
_sntpd=*:281:281:SNTP Server Daemon:/var/empty:/usr/bin/false
_trustd=*:282:282:trustd:/var/empty:/usr/bin/false
_darwindaemon=*:284:284:Darwin Daemon:/var/db/darwindaemon:/usr/bin/false
_notification_proxy=*:285:285:Notification Proxy:/var/empty:/usr/bin/false
_oahd=*:441:441:OAH Daemon:/var/empty:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 콜론(:)을 등호(=)로 대체하여 출력합니다.
이렇게 했을 경우 첫 번째 콜론만 대체되는데 모든 콜론을 대체시키기 위해서는 마지막에 g 옵션을 추가해줘야 합니다.
tail /etc/passwd | sed 's/:/=/g
> tail /etc/passwd | sed 's/:/=/g'
_demod=*=275=275=Demo Daemon=/var/empty=/usr/bin/false
_rmd=*=277=277=Remote Management Daemon=/var/db/rmd=/usr/bin/false
_accessoryupdater=*=278=278=Accessory Update Daemon=/var/db/accessoryupdater=/usr/bin/false
_knowledgegraphd=*=279=279=Knowledge Graph Daemon=/var/db/knowledgegraphd=/usr/bin/false
_coreml=*=280=280=CoreML Services=/var/empty=/usr/bin/false
_sntpd=*=281=281=SNTP Server Daemon=/var/empty=/usr/bin/false
_trustd=*=282=282=trustd=/var/empty=/usr/bin/false
_darwindaemon=*=284=284=Darwin Daemon=/var/db/darwindaemon=/usr/bin/false
_notification_proxy=*=285=285=Notification Proxy=/var/empty=/usr/bin/false
_oahd=*=441=441=OAH Daemon=/var/empty=/usr/bin/false
위에서 설명한 것 처럼 모든 콜론이 등호로 대체되었습니다.
복합 옵션 사용 tail /etc/passwd | sed '1,5 s/:/=/g'
> tail /etc/passwd | sed '1,5 s/:/=/g'
_demod=*=275=275=Demo Daemon=/var/empty=/usr/bin/false
_rmd=*=277=277=Remote Management Daemon=/var/db/rmd=/usr/bin/false
_accessoryupdater=*=278=278=Accessory Update Daemon=/var/db/accessoryupdater=/usr/bin/false
_knowledgegraphd=*=279=279=Knowledge Graph Daemon=/var/db/knowledgegraphd=/usr/bin/false
_coreml=*=280=280=CoreML Services=/var/empty=/usr/bin/false
_sntpd:*:281:281:SNTP Server Daemon:/var/empty:/usr/bin/false
_trustd:*:282:282:trustd:/var/empty:/usr/bin/false
_darwindaemon:*:284:284:Darwin Daemon:/var/db/darwindaemon:/usr/bin/false
_notification_proxy:*:285:285:Notification Proxy:/var/empty:/usr/bin/false
_oahd:*:441:441:OAH Daemon:/var/empty:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 1~5번째 줄만 콜론(:)을 등호(=)로 대체하여 출력합니다.
tail /etc/passwd | sed -n '/Demo/,5p'
> tail /etc/passwd | sed -n '/Demo/,5p'
_demod:*:275:275:Demo Daemon:/var/empty:/usr/bin/false
_rmd:*:277:277:Remote Management Daemon:/var/db/rmd:/usr/bin/false
_accessoryupdater:*:278:278:Accessory Update Daemon:/var/db/accessoryupdater:/usr/bin/false
_knowledgegraphd:*:279:279:Knowledge Graph Daemon:/var/db/knowledgegraphd:/usr/bin/false
_coreml:*:280:280:CoreML Services:/var/empty:/usr/bin/false
/etc/passwd
파일의 마지막 10줄을 출력하는데 Demo가 포함된 라인부터 5줄을 출력합니다.
,+5
로 지정할 경우 상대적으로 검색된 대상부터 5줄을 추가로 출력해줍니다.
> tail /etc/passwd | sed -n '/Demo/,+5p'
_demod:*:275:275:Demo Daemon:/var/empty:/usr/bin/false
_rmd:*:277:277:Remote Management Daemon:/var/db/rmd:/usr/bin/false
_accessoryupdater:*:278:278:Accessory Update Daemon:/var/db/accessoryupdater:/usr/bin/false
_knowledgegraphd:*:279:279:Knowledge Graph Daemon:/var/db/knowledgegraphd:/usr/bin/false
_coreml:*:280:280:CoreML Services:/var/empty:/usr/bin/false
_sntpd:*:281:281:SNTP Server Daemon:/var/empty:/usr/bin/false
awk
Description
텍스트를 처리하는 스크립트 언어이고 '오크'라고 읽습니다.
스크립트이다 보니 옵션이 너무 방대하고 기본 적인 문법을 알아야 합니다.
awk options 'selection _creteria {action}' input-file
usage: awk [-F fs] [-v var=value] [-f progfile | 'prog'] [file ...]
자주 사용되는 옵션은 -F
로 파일 구분자를 지정할 때 사용합니다.
awk를 사용할 때 내장되어있는 변수를 이용해야 하는데 주요 변수는 아래와 같습니다.
- $1, $2, ... $N: N번째 필드
- NR: Number of Records
- NF: Number of Fields
- FS: File Separator (기본 공백)
- RS: Record Separator (기본 개행문자)
- OFS: Output Field Separator
- ORS: Output Record Separator
Examples
wc /etc/passwd | awk '{ print $1 }
~/git-repo/lcalmsky/ [feature/4+*] wc /etc/passwd
123 329 7868 /etc/passwd
~/git-repo/lcalmsky/ [feature/4+*] wc /etc/passwd | awk '{ print $1 }'
123
wc를 이용해 파일의 라인 수, 단어 수, 바이트 수를 출력할 수 있는데 awk를 이용해 첫 번째 필드(공백 기준)만 출력하여 라인 수만 획득할 수 있습니다.
~/git-repo/lcalmsky/ [feature/4+*] wc /etc/passwd | awk '{ print $2 }'
329
~/git-repo/lcalmsky/ [feature/4+*] wc /etc/passwd | awk '{ print $3 }'
7868
마찬가지로 두 번째, 세 번째 필드의 값을 가져올 수도 있습니다.
tail /etc/passwd | awk -F: '{ print $1 }'
~/git-repo/lcalmsky/ [feature/4+*] tail /etc/passwd | awk -F: '{ print $1 }'
_demod
_rmd
_accessoryupdater
_knowledgegraphd
_coreml
_sntpd
_trustd
_darwindaemon
_notification_proxy
_oahd
/etc/passwd 파일의 마지막 10줄을 출력하면서 콜론 기준으로 첫 번째 필드를 출력할 수 있습니다.
tail /etc/passwd | awk -F: '/c/ { print $1 }'
~/git-repo/lcalmsky/ [feature/4+*] tail /etc/passwd | awk -F: '/c/ { print $1 }'
_accessoryupdater
_coreml
_notification_proxy
/etc/passwd 파일의 마지막 10줄을 출력하면서 콜론 기준으로 첫 번째 필드를 가져오는데 'c'가 포함된 줄만 출력할 수 있습니다.
tail /etc/passwd | awk -F: '/c/ { print NR, $1 }'
~/git-repo/lcalmsky/ [feature/4+*] tail /etc/passwd | awk -F: '/c/ { print NR, $1 }'
3 _accessoryupdater
5 _coreml
9 _notification_proxy
내장 변수 NR과 같이 사용하여 Number of Record를 같이 출력할 수 있습니다.
NF를 이용하면 몇 개의 필드를 가지고 있는지 확인할 수 있습니다.
~/git-repo/lcalmsky/ [feature/4+*] tail /etc/passwd | awk -F: '/c/ { print NF, $1 }'
7 _accessoryupdater
7 _coreml
7 _notification_proxy
tail /etc/passwd | awk -F: '/c/ { print NR " -> " $1 }'
~/git-repo/lcalmsky/ [feature/4+*] tail /etc/passwd | awk -F: '/c/ { print NR " -> " $1 }'
3 -> _accessoryupdater
5 -> _coreml
9 -> _notification_proxy
print 뒤에 나오는 부분은 모두 출력되는 것이기 때문에 문자열을 얼마든지 추가할 수 있습니다.
~/git-repo/lcalmsky/ [feature/4+*] tail /etc/passwd | awk -F: '/c/ { print NR "("NF")" " -> " $1 }'
3(7) -> _accessoryupdater
5(7) -> _coreml
9(7) -> _notification_proxy
'Linux' 카테고리의 다른 글
터미널 명령어: 잘라내기, 치환하기 (cut, tr) (0) | 2021.12.27 |
---|---|
터미널 명령어: 정렬과 중복 처리 (sort, uniq) (0) | 2021.12.23 |
터미널 명령어: 텍스트 처리 (head, tail, wc, nl) (0) | 2021.12.18 |
리눅스 alias(별칭) 등록 및 사용법 (0) | 2019.10.07 |
- Total
- Today
- Yesterday
- Java
- 스프링 부트 튜토리얼
- 스프링 부트
- Spring Boot JPA
- 스프링 데이터 jpa
- @ManyToOne
- Jackson
- intellij
- gRPC
- Spring Boot Tutorial
- 스프링 부트 애플리케이션
- 함께 자라기 후기
- spring boot application
- 스프링 부트 회원 가입
- proto3
- 알고리즘
- JPA
- Linux
- spring boot app
- 함께 자라기
- JSON
- QueryDSL
- spring boot jwt
- 클린 아키텍처
- Spring Data JPA
- 스프링부트
- 헥사고날 아키텍처
- Spring Boot
- r
- leetcode
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |