텍스트 전처리 (Text Preprocessing): 주어진 텍스트에서 노이즈와 같이 불필요한 부분을 제거하고, 문장을 표준 단어들로 분리, 각 단어의 품사를 파악하는 것까지 포함되는 사전 작업들 텍스트 전처리 단계1. 정제 (cleaning): 불필요한 노이즈 제거, 불용어 (stopword) 제거2. 토큰화 (Tokenization): 주어진 텍스트를 원하는 단위(토큰)으로 나누는 작업 (i.e., sentence tokenization, work tokenization)3. 정규화: 같은 의미를 가진 동일한 단어임에도 불구하고 다른 형태로 쓰여진 단어들을 통일시켜 표준 단어로 만드는 작업 (i.e., go = goes), 방법에 따라 어간 추출과 표제어 추출로 나뉨.4. 품사 태깅: 단어를 문법적인..
학부 졸업을 할 때쯤 바로 중소기업/스타트업에 취업을 할지, 1년정도 더 컴퓨터 기초/알고리즘을 공부해서 대기업을 노릴지, 대학원을 갈지 이 3가지 선택사항에 대해 엄청나게 고민을 했던 것 같다. 특히 가고싶은 분야가 신입을 거의 안뽑는 곳이여서 1년 더 공부한다해서 대기업에 갈 수 있을지에 대해 매일 생각했었다. 다행히 열심히 교수님들 방에 문을 두들긴 끝에 어렵지 않게 졸업 전에 괜찮아보이는 중소기업에 입사하게 되었다. ('괜찮은' 이라는 기준이 사회초년생 입장에서는 너무 어려워서 교수님들한테 무작정 메일을 보내거나 좋은 회사 추천해달라고 찾아가는 등 지금 생각해보면 철면피도 이런 철면피가 없다...ㅋㅋㅋ) 그렇게 들어간 회사에서 상사가 정~말 정말 이상하고 남다른 꼰대력을 보여 1년만에 탈주하고 고..
Reference: Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau의 『Operating Systems: Three Easy Pieces』 Sector: 보통 512byte block Disk: 섹터들의 배열일뿐이다 (어렵게 생각 ㄴㄴ) - 많은 파일 시스템들은 4KB를 한번에 읽고 쓴다. 그러나 디스크 update를 할때는 512byte write만 가능하다.

Reference: Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau의 『Operating Systems: Three Easy Pieces』 - I/O는 컴퓨터 시스템에서 매우 중요한 부분이다. - 당연히 모든 프로그램에서 입력과 출력이 필요하기 마련이기 때문이다. 시스템 구조 컴퓨터 시스템에서 I/O 계층구조를 간단하게 표시하면, 다음과 같이 나타낼 수 있다. 1. Memory Bus - 그림의 가장 상위계층에 해당하며, CPU가 메모리 버스를 통해 메인 메모리와 연결되어 있음을 보인다 2. General I/O Bus - 어떤 장치들은 I/O 버스를 통해 연결된다. - 최신 시스템에서는 PCI가 된다. - 그래픽과 같은 높은 성능을 보이는 I/O 장치들이 ..

READ (a page) - 사용자는 플래시 칩 내의 어떤 페이지든 접근할 수 있다 - 장치 위치에 상관없이 대체적으로 빠르다 (10μs정도) - Being able to access any location uniformly quickly means the device is a random access device - 그렇다. 플래시는 랜덤 액세스 장치이다 ERASE (a block) - page를 쓰기 전에, 전체 블럭을 지워야한다 - Erase, importantly, destroys the contents of the block (by setting each bit to the value 1) - therefore, you must be sure that any data you care about ..

- SSD는 HDD와 다르게 기계적인 움직임이 없으며(disk arm을 움직여 데이터를 읽는 등) 단순히 트랜지스터들로 이루어져 있다. - random-access memory(DRAM)과는 다르게 SSD는 전원이 꺼져도 정보를 가지고 있는다. - flash메모리( 특히 NAND-based flash)는 1980년대에 Fujio Masuoka에 의해 만들어졌다. 특징점 - To write to a given chunk of it(flash page), you first have to erase a bigger chunk(flash block). - writing too often to a page will cause it to wear out flash기반 SSD 생각해볼 점들 - erase의 비용을 싸..
https://tayoung00.tistory.com/30 SP2-0618, SP2-0611 autotrace 에러 orcl@HR> set autot on SP2-0618: Cannot find the Session Identifier. Check PLUSTRACE role is enabled SP2-0611: Error enabling STATISTICS report 아래 스크립트를 실행한다. SQL> @/u01/app/oracle/produ.. tayoung00.tistory.com 로 해결
import java.util.Deque; import java.util.ArrayDeque; Deque deque = new LinkedList(); //맨 앞에 값 추가 deque.addFirst(1); deque.offerFirst(2); //맨 뒤에 값 추가 deque.addLast(1); deque.offerLast(2); //맨 앞쪽 값 삭제 deque.removeFirst(); deque.pollFirst();