awk 명령어 사용법

조회 수 119406 댓글 1

단축키

Prev이전 문서

Next다음 문서

가 + - Up Down Comment Print

단축키

Prev이전 문서

Next다음 문서

가 + - Up Down Comment Print

1. awk의 기본 개념

2. awk 프로그램의 구조 및 실행

parttern-action-file

awk실행 action을 가진 프로그램 file

패 턴	내 용
BEGIN	입력화일을 읽어들이기 전에 옆에 제시되는 문자을 실행시키도록 한다.
END	awk가 모든 입력을 처리한 후, 옆에 제시되는 문장을 실행시키도록 한다.
expression	식을 평가한 후 이 식이 참, 즉 non-zero이거나 non-null인 경우 문장을 실행한다.
/re/	정규식과 일치하는 문자열을 포함하고 있는 라인에서 문장을 실행한다.
compound-pattern	복합패턴이라는 것으로 &&(and), \|\|(or) , !(not) 그리고 괄호에 의해 연결시킨 것이다. expression의 경우와 마찬가지로 복합 패턴도 참인 경우의 문장을 실행시킨다.
pattern1, pattern2	이러한 패턴을 범위 패턴이라한다. 현재 처리되고 있는 라인이 pattern1과 일치되고, 다음에 따라오 는 라인 중 임의의 라인이 pattern2와 일치할 때, 범위 패턴은 두 라인 사이의 각 라인과 일치한다.

연 산 자	내용
= += -= *= /= %=	배정(assignment)연산자
+ - * / % ++ --	산술 연산자
\|\| && !	논리 연산자(\|\| = OR, && = AND, ! = NOT)
> >= < <= == !=	비교 연산자
v ~p	변수 V가 패턴 P에 부합되면 참
v !~p	변수 V가 패턴 P에 부합되지 않으면 참

변 수	내 용
FILENAME	현재 처리되고 있는 입력 파일의 이름
FS	입력 필드 분리문자
NR	현재 레코드(행)의 번호
NF	현재 레코드(행)의 필드의 갯수
OFS	출력되는 필드의 분리문자

3. awk의 기본예제

출처 : (http://unix.co.kr)

---------------------------------------------------------------------------

[awk 기본 문법]

awk [-f prog-file] [-F c] [ 'pattern {action}' ] [filename]

-f prog-file

awk의 실행 Action을 가진 프로그램 파일 지정

-F c

필드 구별자(FS: Field Separator) 지정

'pattern {action}'

awk program의 command 문장은 single quotes(' ') 또는 double quotes(" ")로
둘러싸여 있습니다.

Input의 각 라인(Line)이 원하는 pattern과 일치하면, action 부분이 실행됩니다.

action 없이 pattern만 있는 경우, 원하는 pattern을 찾으면 각 Input 라인을 그대로
출력합니다.

pattern 없이 action만 있는 경우, Input의 각 라인에 대해 action을 실행합니다.

action 부분은 항상 중괄호({})로 둘러싸여 있습니다.

여러 action을 실행 시, action 사이를 세미콜론(;)이나 new-line 문자로 구분할 수
있습니다.

패턴유형 설 명
BEGIN 입력파일을 읽어 들이기 전에, BEGIN 옆에 제시되는 { } 안의
Action을 실행시킵니다.
END 모든 입력을 처리한 후, END 옆에 제시되는 { } 안의 Action을
실행시킵니다.
expression 식을 평가한 후, 이 식이 참이면 즉 non-zero 이거나 non-null 인 경우,
뒤의 Action을 실행시킵니다.
/re/ 정규식과 일치하는 문자열을 포함하고 있는 라인에서 Action을
실행시킵니다.
compound-
pattern 복합 패턴이라는 것으로 여러 개의 expression을 괄호와 &&(and),
||(or) , !(not) 로 연결시켜 그 결과가 참인 경우 Action을
실행시킵니다.
pattern1,
pattern2 이러한 패턴을 범위 패턴이라고 합니다. 현재 처리되고 있는 라인이
pattern1과 일치되고, 다음에 따라오는 라인 중 임의의 라인이
pattern2와 일치할 때, 범위 패턴은 두 라인 사이의 각 라인과
일치합니다.

filename

awk 프로그램에 입력될 입력 파일 지정

awk에는 awk가 내부적으로 가지는 변수들이 있습니다. 이 변수들을 사용하여, 필드 및
레코드의 구분을 좀 더 다양하게 할 수 있으며, 좀 더 유연한(flexible)프로그램을 짤 수가
있습니다.

아래 표는 각 내부 변수들에 대해서 설명하고 있습니다.

내부 변수 설 명
FILENAME 현재 처리하고 있는 file의 이름
FS Field Separator- 필드 구분자
RS Record Separator - 레코드 구분자
NF Number of Fields - 현재 레코드의 필드 수
NR Number of Records - 현재 레코드의 번호
$1 입력되는 Record의 첫 번째 필드
$n 입력되는 Record의 n 번째 필드
OFS Output Fields Separator - 출력시의 FS.
이 값을 변경하게 되면, 출력시의 FS가 바뀌게 됩니다.
ORS Output Records Separator - 출력시의 RS.
이 값을 변경하게 되면, 출력시의 RS가 바뀌게 됩니다.

내부 변수 사용 예

test.txt 파일을 확인한 결과가 다음는 같았습니다.

$ cat　test.txt

AA aaa bbb ccc ddd
BB bbb ccc ddd eee
CC ccc ddd eee fff
DD ddd eee fff ggg

이 파일의 필드수를 구하는 명령은 다음과 같습니다.

$ awk '{print NF}' test.txt
5
5
5
5

4개의 각 레코드가 가지는 필드 수가 5개씩이므로 화면에는 5가 4번 찍힙니다.

hello.txt 파일의 내용은 다음과 같습니다.

$ cat Hello.txt
Hello, World!!
Be The Reds!!

여기서 awk 명령을 이용하여 Hello 필드를 포함하고 있는 모든 레코드를 출력하기
위한 명령은 다음과 같습니다.

$ awk '/Hello/' Hello.txt
Hello, World!!

action 부분이 없을 때는 Hello 필드를 포함하고 있는 모든 레코드가 출력됩니다.

awk의 Output을 다른 파일로 보내기

awk의 출력 action을 다른 파일로 보내기 위해서는 '>'나 '>>'를 사용하면 됩니다.

현재 디렉토리와 해당 파일의 내용을 확인한 결과는 다음과 같습니다.

$ ls
Hello.txt

$ cat Hello.txt
Hello, World!!
Be The Reds!!

첫 번째 필드는 file1.txt 파일로, 두 번째 필드는 모니터로 출력하려면 다음과 같이
명령을 실행합니다.

$ awk '/Hello/ {print $1 > "file1.txt"; print $2}' Hello.txt
World!!

file1.txt 파일이 없으므로 신규 생성하여 데이터를 입력합니다.
이를 확인한 결과는 다음과 같습니다.

$ ls
Hello.txt file1.txt

$ cat file1.txt
Hello,

일반적인 특수 문자

awk의 검색 패턴을 만들 경우 slash(/)로 감싸서 표현하는데, slash 사이에는 다음과 같은
특수 문자를 사용할 수 있습니다.

특수 문자 설명
| Bar(|)의 왼쪽과 오른쪽의 논리적 OR 연산
+ 선행하는 패턴의 하나 또는 그 이상의 반복
? 선행하는 패턴이 없거나 또는 한번만 나타남을 의미
* 선행하는 패턴의 임의의 횟수의 반복
[] 대괄호([]) 사이의 임의의 문자 하나
[a-z] 두 문자 사이의 임의의 문자 하나
^ 라인의 처음을 의미
$ 라인의 마지막을 의미
. Period 위치의 문자 하나
다음 문자의 특수한 의미를 없앰
() 패턴을 그룹화 함


$ cat Hello.txt
Hello, World!!
Be The Reds!!

다음의 명령은 위의 파일에서 Be로 시작되는 레코드를 검색하여 출력합니다.

$ awk '/^Be/' Hello.txt
Be The Reds!!

관계 연산자

awk의 패턴 표시에도 관계 연산자인 <, <=, ==, !=, >=, >를 사용할 수 있습니다.

관계 연산자 설명
A < B A가 B보다 작다.
A <= B A가 B보다 작거나 같다.
A == B A와 B가 같다.
A != B A와 B가 같지 않다.
A >= B A가 B보다 크거나 같다.
A > B A가 B보다 크다.


$ cat num.txt
1 10 100 1000 10000
10000 1000 100 10 1

다음의 사용예는 첫째 필드의 값이 둘째 필드의 값보다 큰 레코드를 출력하는
것입니다.

$ awk '$1 > $2' num.txt

awk의 제어문은 C의 제어문과 비슷하며 다음과 같이 사용할 수 있습니다.

if 문

if 문의 기본 문법

if(condition) Action
else Action

if 문의 사용 예


$ awk '{if($1 != "Hello,") print $0; else print "Wow!!"}' Hello.txt
Wow!!
Be The Reds!!


첫째 필드가 "Hello,"이면 Wow!!를 출력하고, 아니면 해당 레코드를 출력합니다.
!!$0 은 해당 레코드 전체!!

while 문

while 문의 기본 문법

while(condition) Action

while 문의 사용 예


$ awk '{i=1; while(i<=2) {print $(i); i++}}' Hello.txt

Hello,
World!!
Be
The

변수 i는 1의 정수값(i=1)으로 시작하고 계속 1씩 증가(i++) 합니다. i 값이 2보다 작거나 같을 동안
Action을 실행하는데, 출력될 필드도 변수 i 값에 맞추어 다르게 선정됩니다.

for 문

for 문의 기본 문법

for (initialize; final; increment) { Action }

for 문의 사용 예

$ awk '{for(i=1;i<NF;i++) {print $(i)}}' Hello.txt

Hello,
Be
The

변수 i는 1의 정수값(i=1)으로 시작하여 계속 1씩 증가(i++) 합니다.
i 값이 레코드의 필드 수(NF)보다 작을 동안만 Action을 실행하는데, 출력될 필드도 변수 i 값에
맞추어 다르게 선정됩니다.

awk에는 print, printf 외에 다음과 같은 내장함수가 있습니다.

내장함수 설명
length(x) 문자 x의 길이 반환

awk '{print length($1); print $1}' hello.txt
6
Hello,
2
Be
sqrt(x) x의 평방제곱근 값 반환
log(x) x의 Log 값 반환
exp(x) x의 Exponential 값 반환
int(x) x의 정수 값 반환
cos(x) x의 Cosine 값 반환
atan(x) x의 Arctangent 값 반환
rand(x) 0에서 1사이의 임의의 값 반환
sin(x)/td> x의 Sine 값 반환
sran(x) rand(x)의 새로운 Seed 값 반환
match(s, r) r번 발생하는 s의 위치를 돌려주거나 0을 반환
substr(s, m, n) s 문자열에서 m 위치에서 시작하여 n개의 문자를 반환
sub(r, t, s) s 문자열에 있는 첫 번째 r과 t를 치환
gsub(r, t, s) sub()와 같으나 해당하는 모든 경우를 치환
split(s, array, sep) 문자열 s를 array[1]..array[n]으로 나눕니다.
sep이 지정되지 않으면 FS 값을 기본으로 합니다.
index(s1, s2) s1에서 s2 문자가 검색된 위치를 알려줍니다.
toupper(s) 문자 s를 대문자로 치환
tolower(s) 문자 s를 소문자로 치환
system(command) 유닉스 명령어 command를 실행하고 exit 상태를 반환

« Prev |(파이프), grep 명령어에 대해서

|(파이프), grep 명령어에 대해서 2006.02.06by 〈

sed 사용법 Next »

sed 사용법 2006.02.16by 〉

♥ 15

Dreamy의 코드 스크랩

내가 모으고 내가 보는

Category

List of Articles
번호	분류	제목	날짜	조회 수	추천 수
481	MFC	API를 이용하는 유니코드와 ANSI 문자열간의 변환 방법	2006.04.14	67263	0
480	MFC	[C] Unicode 사용에 대하여	2006.04.14	51172	0
479	MFC	시작프로그램 레지스트리에 등록/해제 함수	2006.04.14	49932	0
478	일반	[PDK] PDK에서 난수 발생 함수	2006.05.04	40766	0
477	C	16진수 문자열을 Int 형으로 변환하는 함수 1	2006.05.11	49608	0
476	MFC	노트패드를 이용한 덤프	2006.05.19	37863	0
475	MFC	시스템 출력 리디렉션 - 도스 커맨드 결과 받아오기	2007.08.14	57235	0
474	MFC	리사이징 다이얼로그(Resizing dialog)	2008.03.24	51210	0
473	MFC	현재 실행된 어플리케이션의 디렉토리 적용하기	2008.05.07	44875	0
472	MFC	현재디렉토리의 파일리스트들을 알아오는 클래스 CFindFile	2008.05.07	67202	0
471	LINUX	Unix Find 명령 기본 사용법	2006.02.02	53927	16
470	LINUX	UNIX COMMAND (5) : grep, sed, awk 등	2006.02.06	25330	66
469	LINUX	\|(파이프), grep 명령어에 대해서	2006.02.06	36875	17
»	LINUX	awk 명령어 사용법 1	2006.02.16	119406	15
467	LINUX	sed 사용법 1	2006.02.16	46175	21

태그 쓰기

awk 명령어 사용법

단축키

단축키

Dreamy의 코드 스크랩

내가 모으고 내가 보는

나눔글꼴 설치 안내

이 PC에는 나눔글꼴이 설치되어 있지 않습니다.