크롤링(crawling)크롤링이란 단어는 웹 크롤러(crawler)라는 단어에서 시작한 말이다.크롤러란 조직적, 자동화된 방법으로 월드와이드 웹을 탐색하는 컴퓨터 프로그램이다.(출처: 위키백과)크롤링은 크롤러가 하는 작업을 부르는 말로, 여러 인터넷 사이트의 페이지(문서, html 등)를 수집해서 분류하는 것이다.대체로 찾아낸 데이터를 저장한 후 쉽게 찾을 수 있게 인덱싱한다. 파싱(parsing)파싱이란 어떤 페이지(문서, html 등)에서 내가 원하는 데이터를 특정 패턴이나 순서로 추출하여 정보를 가공하는 것이다.위 문장만 보면 굉장히 간단해 보이지만 컴퓨터 과학적 정의를 보면 파싱이란 일련의 문자열을 의미있는 토큰(token)으로 분해하고 이들로 이루어진 파스 트리(parse tree)를 만드는 과..
제어자(modifier)란 클래스, 변수, 메서드의 선언부에 사용되어 부가적인 의미를 부여한다. JAVA를 공부하면서 가장 많이 인식하고 공부하는 제어자는 접근제어자(access modifier)다. 접근제어자는 public, protected, default, private 총 4 가지로프로그래머가 객체의 맴버들에게 접근을 제어하기 위해 사용되는 제어자다.데이터 감추기(data hiding)라고 하며, 캡슐화(encapsulation)에 해당한다.(캡슐환란 데이터(속성)와 데이터를 처리하는 함수를 하나로 묶는 것이다.다시말해 객체 외부에서는 객체 내부 정보를 직접 접근하거나 조작할 수 없고,외부에서 접근할 수 있도록 정의된 오퍼레이션을 통해서만 관련 데이터에 접근할 수 있다.-getter, setter..
전에 작성한 글 참고추상클래스: http://aftersiesta.tistory.com/5인터페이스: http://aftersiesta.tistory.com/4 추상클래스와 인터페이스를 비교해보자. 공통점추상클래스(abstract class)와 인터페이스(interface)를 공부하다보면 굉장히 비슷하다는 것을 알 수 있다.둘다 자식클래스에게 구현을 강조해 틀을 잡는 역할을 한다.그리고 new로 객체를 생성할 수 없고 추상클래스는 상속, 인터페이스는 구현을 통해 객체를 생성해야 한다. 차이점추상클래스- 참조 타입(reference type)이 class다.인터페이스- 참조 타입(reference type)이 interface다. 추상클래스- extends를 통해 객체를 생성 가능하다.(상속)인터페이스- ..
추상메서드 (abstract method) 추상메서드란 미완성 메서드로서 구현부는 작성하지 않고 선언부만 작성한 매서드이다. abstract 제어자를 이용해 추상메서드를 선언할 수 있다. abstract public void example (); 추상클래스 (abstract class) 추상클래스란 미완성 클래스로 추상메서드처럼 abstract 를 이용하여 선언해준다. 클래스가 한개 이상의 추상메서드를 포함하면 무조건 그 클래스는 추상클래스가 된다. 하지만 추상클래스에 추상메서드가 없더라도 abstract class 로 선언하면 추상클래스로 인지된다. 반드시 상속을 통해서만 완성된다. 추상클래스로는 객체 생성을 못한다. 추상클래스를 상속받은 자식 클래스는 무조건 조상 클래스(추상클래스)의 추상메서드를 모..
오랜만에 JAVA의 인터페이스를 복습해보려고 한다.복습이므로 기억해두고자 하는 인터페이스의 특징들만 정리해 두려고 한다. 인터페이스(interface) 인터페이스는 자바 프로그래밍 언어에서 클래스들이 구현해야 하는 동작을 지정하는데 사용되는 추상형이다.(위키백과의 정의)풀어서 말하자면 한 사람이 혼자 코드를 작성하는 경우엔 불편함이 없겠지만 여러명이 함께 코드를 코드를 작성할 경우 특정 클래스는 약속한 틀이 있을 것이다.그리고 그 약속한 틀을 인터페이스로 구현하는 것이다. 특징 - 인터페이스 내의 모든 메소드들이 정의상 추상적이기 때문에 abstract 키워드가 필요하지 않다.-> 인터페이스 내에 존재하는 메소드는 무조건 public abstract로, 변수는 무조건 public static final로..
정규표현식(정규식)은 영어로 regular expression 간단히 regex 또는 regexp. 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어다. 정규표현식을 사용하기 전 용어들 부터 알아보자. 정규표현식에서 사용되는 기호를 meta 문자라고 표현하는데, 표현식에서 내부적으로 특정 의미를 가지는 문자를 말한다. 간단한 예시로 특수 문자를 이용해 정규표현식 패턴을 만들어 보자. var pattern = \ab*c\; 또는 정규표현식 객체를 사용해서 생성도 가능하다. var pattern = new RegExp("ab*c"); 지금 생성한 패턴은 a 다음 b 가 0번 이상 반복되고(*) 그 뒤에 c 가 붙는 패턴을 의미한다. "abeaabbbcd" 이 문자열에서 "abbbc"가 패턴..