# I. 몽고DB 시작

## PART I 몽고DB 시작

## 몽고DB 소개

ℹ️ **손쉬운 사용**

> 몽고DB는 `도큐먼트 지향` 데이터베이스

* 관계형 모델을 사용하지 않는 주된 이유는 `scale-out`을 쉽게 하기 위함
* 그밖에도, 행 개념 대신 보다 유연한 `도큐먼트 모델`을 사용
  * 내장 도큐먼트와 배열을 허용하여 복잡한 계층 관계를 하나의 레코드로 표현 가능
* 고정된 스키마가 없음
  * 필요할 때마다 쉽게 필드를 추가하거나 제거 가능

ℹ️ **확장 가능한 설계**

> 몽고DB는 `분산 확장`을 염두에 두고 설계

* 도큐먼트 지향 데이터 모델은 데이터를 여러 서버에 더 쉽게 분산
* 도큐먼트를 `자동으로 재분배`하고 사용자 요청을 올바른 장비에 `라우팅`하\`여 클러스터 내 데이터 **양과 부하 조절**

<figure><img src="/files/3d7QZtHRWZsnJxjlximR" alt=""><figcaption></figcaption></figure>

출처: <https://velog.io/@ha0kim/MongoDB-in-Action-12>

ℹ️ **다양한 기능**

> DBMS의 대부분의 기능과 더불어 아래와 같은 기능을 제공

* 인덱싱
* 집계
* 특수한 컬렉션 유형
* 파일 스토리지

ℹ️ **고성능**

> 몽고DB는 모든 측면에서 고성능을 유지하기 위해 설계

* 동시성과 처리량을 극대화하기 위해 `WiredTiger storage engine`에 `opportunistic locking`을 사용
* 캐시처럼 제한된 용량으로 램으로 쿼리에 알맞은 인덱스를 자동으로 선택

ℹ️ **몽고DB의 철학**

> 몽고DB 프로젝트의 주 관심사는 확장성이 높으며 유연하고 빠른
>
> 즉, 완전한 기능을 갖춘 데이터 스토리지를 만드는 일

## 몽고DB 기본

### 도큐먼트

> 몽고 DB의 핵심은 정렬된 키와 연결된 값의 집합으로 이뤄진 도큐먼트

* 도큐먼트의 키는 `문자열`
  * 몇 가지 예외(`\0`, `.`, `$`)를 제외하면 어떤 UTF-8 문자든 사용 가능
* `데이터형`과 `대소문자`를 구별
* `키 중복` 불가능

### 컬렉션

ℹ️ **동적 스키마**

> 컬렉션은 동적 스키마를 가지므로
>
> 하나의 컬렉션 내 도큐먼트들이 모두 다른 구조를 가질 수 있다.

ℹ️ **네이밍**

> 컬렉션은 이름으로 식별

* 아래를 제외한 어떤 UTF-8 문자열이든 사용 가능
  * `\0` (컬렉션명의 끝을 나타내는 문자)
  * `system.`으로 시작하는 컬렉션명 (예약어)
  * `$` (예약어)

ℹ️ **서브컬렉션**

> 서브컬렉션의 네임스페이스에 `.` 문자를 사용해 컬렉션을 쳬계화

* 단지 체계화를 위함이며 부모/자식 컬렉션과는 아무런 관계가 없음
* 특별한 속성은 없지만 여러 몽고DB 툴에서 지원
* 몽고DB 데이터를 체계화하는 훌륭한 방법

### 데이터베이스

> 몽고DB의 단일 인스턴스는 여러 데이터베이스를 호스팅할 수 있으며,
>
> 각 데이터베이스를 완전히 독립적으로 취급할 수 있다.

컬렉션과 마찬가지로 데이터베이스는 이름으로 식별된다.

데이터베이스 이름에는 아래 제약 조건을 제외하고 어떤 UTF-8 문자열이든 사용 가능하다.

* 빈 문자열
* `/, \, ., ' ', *, <, >, :, |, ?, $, , \0` 문자열 포함 불가
* 이름은 대소문자 구별
* 이름은 최대 64바이트

### 몽고DB 시작

서버를 시작하려면 원하는 유닉스 명령행 환경에서 mongod 실행 파일을 실행

* mongod는 인수 없이 실행 시 기본 데이터 디렉터리로 `/data/db`를 사용

```bash
$ mongod
```

### 셸 소개

> 명령행에서 몽고DB 인스턴스와 상호작용하는 자바스크립트 셸을 제공

**셸 실행**

* 셸은 완전한 자바스크립트 해석기이며 임의의 자바스크립트 프로그램을 실행

```bash
$ mongo

# docker 사용 시
$ docker run --name mongo -d -p 27017:27017 mongo
$ docker exec -it mongo mongosh
```

표준 자바스크립트 라이브러리의 모든 기능을 활용 가능

```bash
test> Math.sin(Math.PI / 2)
1

test> new Date("20109/1/1");
ISODate('+020109-01-01T00:00:00.000Z')
```

셸은 시작할 때 몽고DB 서버의 test 데이터베이스에 연결하고, 데이터베이스 연결을 전역 변수 db에 할당

* 셸에서는 주로 이 변수를 통해 몽고DB에 접근

  ```bash
  # 현재 db에 할당된 데이터베이스 확인
  test> db
  test

  # db 변수에서 컬렉션에 접근
  test> test.movies
  ```

### 셸 기본 작업

> 셸에서 생성, 읽기, 갱신, 삭제의 네 가지 기본적인 작업(CRUD) 제공

#### 생성

> `insertOne`

* 도큐먼트를 나타내는 자바스크립트 객체인 지역 변수를 생성

```sql
movie = {
    "title": "Star Wars: Episode IV - A New Hope",
    "director": "George Lucas",
    "year": 1977
}
db.movies.insertOne(movie)
```

#### 읽기

> `find`, `findOne`

```sql
db.movies.findOne()
```

* `find`, `findOne`은 쿼리 도큐먼트 형태로 조건 전달도 가능
* 쿼리에서 일치하는 도큐먼트로 결과를 제한

#### 갱신

> `updateOne`

```sql
db.movies.updateOne({"title": "Star Wars: Episode IV - A New Hope"},
    {$set : {reviews:[]}}
)
```

#### 삭제

> `deleteOne`, `deleteMany`

도큐먼트를 데이터베이스에서 영구적으로 삭제

* 필터와 일치하는 모든 도큐먼트 삭제 시 deleteMany 사용

```sql
db.movies.deleteOne({"title": "Star Wars: Episode IV - A New Hope"})
```

### 데이터형

> 몽고DB는 JSON의 키/값 쌍 성질을 유지하면서 추가적인 데이터형을 지원

ℹ️ **기본 데이터형**

> 가장 일반적인 데이터형

* **null**
* **boolean**
* **숫자**
  * 셸은 64비트 부동소수점 수를 기본으로 사용
  * 4바이트 혹은 8바이트 부호 정수는 각각 NumberInt, NumberLong 클래스를 사용
* **문자열**
  * 어떤 UTF-8 문자열이든 문자열형으로 표현
* **날짜**
  * 1970년 1월 1일부터의 시간을 1/1000초 단위로 나타내는 64비트 정수로 날짜를 저장
  * 표준 시간대는 저장하지 않음
* **정규 표현식**
  * 쿼리는 자바스크립트의 정규 표현식 문법 사용 가능
* **배열**
  * 값의 set, list를 배열로 표현 가능
* **내장 도큐먼트**
  * 부모 도큐먼트의 값으로 내장된 도큐먼트 전체를 포함 가능
* **객체 ID**
  * 객체 ID는 도큐먼트용 12바이트 ID

ℹ️ **날짜**

* 새로운 Date 객체 생성 시 항상 `Date()`가 아닌 `new Date()`를 호출해야 한다.
* 함수로 생성자를 호출(Date())하면 실제 Date 객체가 아닌 날짜의 문자열 표현을 반환
* 셸에서는 날짜가 현지 시간대 설정을 이용해 표시
  * 하지만, DB의 날짜는 1970년 1월 1일부터의 시간을 1/1000초 단위로 저장하여 표준 시간대 정보는 없음

ℹ️ **배열**

> 정렬 연산(list, stack, queue)), 비정렬 연산(set)에 호환성 있게 사용 가능

```sql
{"things" : ["pie", 3.14]}
```

* 배열은 서로 다른 데이터형을 값으로 포함 가능
* 도큐먼트 내 배열의 장점으로 몽고DB가 배열 구조를 `이해`하고, 배열의 내용에 작업을 수행하기 위해 내부에 도달하는 `방법`을 안다는 점
  * 따라서 배열에 쿼리하거나 배열의 내용을 이용해 인덱스 생성 가능

ℹ️ **내장 도큐먼트**

> 내장 도큐먼트를 사용해 데이터를 키/값 쌍의 평면적인 구조보다 자연스러운 방법으로 구성

```JSON
{
    "name": "Jone Doe",
    "address": {
        "street": "123 PArk Street",
        "city": "Anytown",
        "state": "NY"
    }
}
```

* 배열과 마찬가지로 내장 도큐먼트의 `구조를 이해`하고, `인덱스`를 구성하고, `쿼리`하며, `갱신`하기 위해 내장 도큐먼트 내부에 접근
* 내장 도큐먼트를 적절히 사용하면 좀 더 자연스럽게 정보 표현 가능
* 단, 몽고DB에서는 더 많은 데이터 반복이 생길 수 있다는 단점이 존재

#### \_id & ObjectId

> 몽고DB에 저장된 모든 도큐먼트는 `_id` 키를 가진다.

"\_id" 키 값은 어떤 데이터형이어도 상관없지만 "ObjectId"가 기본

**ObjectIds**

ObjectId는 "\_id"의 `기본 데이터형`이다.

* ObjectId 클래스는 가볍고, 여러 장비에 걸쳐 전역적으로 고유하게 생성하기 쉽게 설계
* ObjectId를 사용하는 주요 이유는 몽고DB의 분산 특성 때문
* 몽고DB는 분산 DB로 설계되어 샤딩된 환경에서 고유 식별자를 생성하는 것이 중요

ObjectId `12바이트`는 아래와 같이 생성

* **첫 4바이트**는 1970년 1월 1일부터의 시간을 1/1000초 단위로 저장하는 `타임 스탬프`
* **다음 5바이트**는 `랜덤 값`
* **최종 3바이트**는 서로 다른 시스템에서 충돌하는 아이디를 생성하지 않도록 랜덤 값으로 시작하는 `카운터`

```
(0 1  2 3) (4 5 6 7 8) (9 10 11)
타임스탬프    랜덤         카운터:랜덤 시작 값
```

* 앞 9바이트는 1초 동안 여러 장비와 프로세스에 걸쳐 유일성을 보장
* 마지막 3바이트는 단순히 증분하는 숫자로, 1초 내 단일 프로세스의 유일성을 보장
* 고유한 아이디는 프로세스당 1초에 256^3(1677만 7216)개까지 생성

**\_id 자동 생성**

* 도큐먼트를 입력할 때 "\_id" 키를 명시하지 않으면 입력된 도큐먼트에 키가 자동으로 추가

### 몽고DB 셸 사용

다른 장비나 포트에 mongod를 연결하려면 셸을 시작할 때 호스트명, 포트, DB를 명시해야 한다.

```bash
$ mongo some-host:30000/myDB
```

**셸 활용 팁**

* `help`: 셸에 내장된 도움말 확인
* `db.help`: 데이터베이스 수준의 도움말
* `db.foo.help()`: 컬렉션 수준의 도움말
* 함수의 기능을 알고 싶으면 함수명을 괄호 없이 입력

## 도규먼트 생성/갱신/삭제

### 삽입

> 도큐먼트를 삽입하려면 컬렉션의 `insertOne` 메서드 사용

```sql
db.movies.insertOne({"title": "Stand by Me",})
```

> 여러 도큐먼트를 컬렉션에 삽입하려면 `insertMany`로 도큐먼트 배열을 데이터베이스에 전달
>
> 도큐먼트를 대량 삽입하므로 효율적

```sql
db.movies.insertMany([{"title": "Ghostbusters"},
    {"title": "E.T."},
    {"title": "Blade Runner"}]);
```

`insertMany` 사용으로 대량 삽입 시 배열 중간에 있는 도규먼트에서 특정 유형의 오류가 발생할 경우, 정렬 연산을 선택했는지, 비정렬 연산을 선택했는지에 따라 발생하는 상황이 달라진다.

* 정렬된 삽입(기본값)
  * 옵션 도큐먼트 "ordered" 키에 true 지정
  * 삽입에 전달된 배열이 삽입 순서를 정의
  * 도큐먼트가 삽입 오류를 생성하면, 배열에서 이후 도큐먼트는 삽입되지 않는다.
* 정렬되지 않은 삽입
  * 옵션 도큐먼트 "ordered" 키에 false 지정
  * 몽고DB는 성능을 개선하려고 삽입을 재배열
  * 몽고DB는 일부 삽입의 오류 발생 여부에 관계없이 모든 도큐먼트 삽입을 시도

```sql
db.movies.insertMany([
    {"_id": 3, "title": "Sixteen Candles"},
    {"_id": 4, "title": "The Terminator"},
    {"_id": 4, "title": "The Princess Bride"},
    {"_id": 5, "title": "Scarface"},
])
```

{% hint style="info" %}
**대량쓰기 API**

몽고DB는 한 번의 호출로 여러 유형의 작업을 일괄 처리하는 대량 쓰기 API를 지원

[대량쓰기 API](https://www.mongodb.com/ko-kr/docs/languages/java/reactive-streams-driver/current/write/bulk-writes/) 참고
{% endhint %}

.

✅ **삽입 유효성 검사**

* 몽고DB는 삽입된 데이터에 최소한의 검사를 수행
  * "\_id" 필드가 존재하지 않으면 새로 추가하고, 모든 도큐먼트는 `16MB`보다 작어야 하므로 크기를 검사
* 대개 나쁜 스키마 설계를 예방하고 일관된 성능을 보장
  * doc라는 도큐먼트의 BSJON 크기를 보려면 쉘에서 `object.bsonsize(doc)`를 실행

### 삭제

> 데이터 삭제는 `deleteOne`, `deleteMany` 메서드 사용으로

```sql
db.movies.deleteOne({"_id": 4})
db.movies.deleteMany({"year": 1984})
```

* 👉🏻 `deleteOne`은 필터와 일치하는 `첫 번째 도큐먼트`를 삭제
  * 첫 번쨰의 기준은 삽입 순서, 갱신 상태, 인덱스 등 몇 가지 요인에 따라 달라진다.
* 👉🏻 `deleteMany`는 필터와 일치하는 모든 도큐먼트를 삭제

.

✅ **drop**

`deleteMany`를 사용해 모든 도큐먼트 제거

```sql
db.movies.deleteMany({})
```

전체 컬렉션 삭제 시 `drop`을 사용하는 편이 빠르다.

* 그리고 빈 컬렉션에 인덱스를 재생성

```sql
db.movies.drop()
```

### 갱신

> `updateOne`, `updateMany`, `replaceOne` 갱신 메서드

`updateOne`, `updateMany`는 필터 도큐먼트를 첫 번째 매개변수로, 변경 사항을 설명하는 수정자 도큐먼트를 두 번째 매개변수로 사용

`replaceOne`도 첫 번째 매개변수로 필터를 사용하지만, 두 번째 매개변수는 필터와 일치하는 도큐먼트를 교체할 도큐먼트

.

#### **도큐먼트 치환**

> `replaceOne`은 도큐먼트를 새로운 것으로 치환

⭐️ 대대적인 스키마 마이그레이션에 유용

```sql
db.users.insertOne({
    "name": "joe",
    "friends": 32,
    "enemies": 2
})

// friend, enemies 필드를 relationships 라는 서브도큐먼트로 이동
var joe = db.users.findOne({"_id": ObjectId("672c2c8f07b2c3060aa45bc2")})
joe.relationships = {"friends": joe.friends, "enemies": joe.enemies};
joe.username = joe.name;
delete joe.friends;
delete joe.enemies;
delete joe.name;
db.users.replaceOne({"name": "joe"}, joe)
```

.

#### **갱신 연산자**

> 부분 갱신에는 원자적 갱신 연산자를 사용

⭐️ 갱신 연산자는 키를 변경, 추가, 제거하고, 배열과 내장 도큐먼트를 조작하는 복잡한 갱신 연산을 지정하는데 사용하는 특수키

👉🏻 **"$inc"**

```sql
db.analytics.insertOne({
    "url": "www.example.com",
    "pageviews": 52
})
// 페이지 방문 시 URL로 페이지를 찾고, pageviews 증가
db.analytics.updateOne({"url": "www.example.com"},
    {"$inc": {"pageviews": 1}})
```

👉🏻 **"$set"**

* `$set`은 필드 값을 설정
* 필드가 존재하지 않으면 새 필드가 생성
* 스키마를 갱신하거나 사용자 정의 키를 추가할 때 편리
* `$set`은 key의 데이터형도 변경 가능
* `$unset`으로 key/value 모두 제거 가능

```sql
db.users.insertOne({
    "name": "joe",
    "age": 30,
    "sex": "male",
    "location": "Wisconsin"
});
db.users.updateOne({"_id": ObjectId("672c304b07b2c3060aa45bc6")},
    {"$set": {"favorite book": "War and Pace"}});
db.users.updateOne({"_id": ObjectId("672c304b07b2c3060aa45bc6")},
    {"$unset": {"favorite book": 1}})
```

{% hint style="info" %}
키를 추가, 변경, 삭제할 때는 항상 `$` 제한자를 사용해야 한다.
{% endhint %}

👉🏻 **증가와 감소**

> `$inc` 연산자는 이미 존재하는 키의 값을 변경하거나 새 키를 생헝하는 데 사용

⭐️ 분석, 분위기, 투표 등과 같이 자주 변하는 수치 값을 갱신하는 데 유용

```sql
db.games.insertOne({"game": "pinball", "user": "joe"})

db.games.updateOne({"game": "pinball", "user": "joe"},
    {"$inc": {"score": 50}})
```

`$inc`는 `$set`과 비슷하지만 숫자를 증감하기 위해 설계

* int, long, double, decimal 타입 값에만 사용 가능
* 또한, `$inc`의 키 값은 무조건 숫자
* 다른 데이터형을 반환하려면 `$set`이나 배열 연산자 사용

👉🏻 **배열 연산자**

> 배열을 이루는 데 갱신 연산자 사용 가능

연산자는 리스트에 대한 인덱스를 지정할 수 있을 뿐 아니라 셋처럼 이중으로 사용 가능

1️⃣ **요소 추가**

* `$push`는 배열이 이미 존재하면 배열 긑에 요소를 추가하고, 존재하지 않으면 새로운 배열을 생성

```sql
db.blog.posts.insertOne({"title": "A blog post", "content": "..."})
db.blog.posts.updateOne({"title": "A blog post"},
    {
        "$push": {
            "comments":
                {
                    "name": "joe", "email": "joe@example.com",
                    "comtent": "nice post."
                }
        }
    })
```

`$push`에 `$each` 제한자를 사용하면 작업 한 번으로 값을 여러 개 추가할 수 있다.

```sql
// 배열에 새로운 요소 세 개 추가
db.stock.ticker.updateOne({"id": "GOOG"},
    {"$push": {"hourly": {"$each": [562.776, 562.790, 559.123]}}})
```

배열을 특정 길이로 늘이려면 `$slice`를 `$push`와 결합해 사용

* 배열이 특정 크기 이상으로 늘어나지 않게 하고 효과적으로 'top N' 목룍을 만들 수 있음
* 아래 예제는 배열에 추가할 수 있는 요소의 개수를 10개로 제한
  * 10보다 크면 마지막 10개 요소만 유지
  * `$slice`는 도큐먼트 내에 큐를 생성하는 데 사용

```sql
db.movies.updateOne({"genre": "horror"},
    {
        "$push": {
            "top10": {
                "$each": ["Nightmare on Elm Street", "Saw"],
                "$slice": -10
            }
        }
    })
```

trimming 하기 전 `$sort` 제한자를 `$push` 작업에 적용 가능

* rating 필드로 배열의 모든 요소를 정렬한 후 처음 10개의 요소를 유지
* `$each`를 반드시 포함
* `$slice`나 `$sort`를 배열상에서 `$push`와 함께 쓰려면 반드시 `$each`도 사용

```sql
db.movies.updateOne({"genre": "horror"},
    {
        "$push": {
            "top10": {
                "$each": [{
                    "name": "Nightmare on Elm Street",
                    "rating": 6.6
                },
                    {"name": "Saw", "rating": 4.3}],
                "$slice": -10,
                "$sort": {"rating": -1}
            }
        }
    })
```

2️⃣ 배열을 집합으로 사용하기

* 특정 값이 배열에 존재하지 않을 때 해당 값을 추가하면서, 배열을 집합처럼 처리하려면 쿼리 도큐먼트에 `$ne`를 사용

```sql
# 인용 목록에 저자가 존재하지 않을 경우에만 해당 저자 추가
db.papers.updateOne({"authors cited": {"$ne": "Richie"}},
    {$push: {"authors cited": "Richie"}})
```

`$addToSet`은 `$ne`가 동작하지 않을 경우 사용 가능하고, 중복을 피할 수 있다.

```sql
db.users.updateOne({"_id": ObjectId("672ca876ccf8f87e8793c90a")},
    {"$addToSet": {"emails": "joe@gmail.com"}})
```

고유한 값을 여러 개 추가하려면 `$addToSet`과 `$each`를 결합하여 사용

```sql
db.users.updateOne({"_id": ObjectId("672ca876ccf8f87e8793c90a")},
    {
        "$addToSet": {
            "emails": {
                "$each":
                    ["joe@gmail.com", "joe@python.org"]
            }
        }
    })
```

3️⃣ 요소 제거하기

* 배열을 큐나 스택처럼 사용하려면 배열의 양쪽 끝에서 요소를 제거하는 `$pop`을 사용
  * `{"$pop" : {"key" : 1}}`은 배열의 마지막 요소부터 제거
  * `{"$pop" : {"key" : -1}}`은 배열의 처음 요소부터 제거
* `$poll`은 주어진 조건에 맞는 배열 요소를 제거하는 데 사용

4️⃣ 배열의 위치 기반 변경

* 몽고DB에서는 쿼리 도큐먼트와 일치하는 배열 요소 및 요소의 위치를 알아내서 갱신하는 위치 연산자 `$`를 제공
* 위치 연산자는 **첫 번쨰로 일치하는** 요소만 갱신

```sql
// John이라는 사용자가 이름을 Jim으로 갱신 시, 위치 연산자를 사용해 댓글 내 해당 항목을 갱신
db.blog.updateOne({"comments.author": "John"},
    {"$set": {"comments.$.author": "Jim"}})
```

.

#### **갱신 입력**

> 갱신 입력은 특수한 형태를 갖는 갱신

* 갱신 조건에 맞는 도큐먼트가 존재하지 않을 때는 쿼리 도큐먼트와 갱신 도큐먼트를 합쳐서 새로운 도큐먼트를 생성
* `updateOne`과 `updateMany`의 세 번째 매개변수는 옵션 도큐먼트로, 갱신 입력을 지정

```sql
db.analytics.updateOne({"url": "/blog"}, {"$inc": {"pageviews": 1}}, {"upsert": true})
```

`$setOnInsert`는 도큐먼트가 삽입될 때 필드 값을 설정하는 데만 사용하는 연산자

```sql
db.users.updateOne({}, {"$setOnInsert": {"createdAt": new Date()}},
    {"upsert": true})
```

{% hint style="info" %}
ObjectId가 도큐먼트가 작성된 때의 타임스탬프를 포함하므로 일반적으로 createdAt가 반드시 필요하지 않음

하지만, `$setOnInsert`는 패딩을 생성하고 카운터를 초기화하는 데 쓰이면, ObjectId를 사용하지 않는 컬렉션에 유용
{% endhint %}

## PART I 몽고DB 시작

## 몽고DB 소개

ℹ️ **손쉬운 사용**

> 몽고DB는 `도큐먼트 지향` 데이터베이스

* 관계형 모델을 사용하지 않는 주된 이유는 `scale-out`을 쉽게 하기 위함
* 그밖에도, 행 개념 대신 보다 유연한 `도큐먼트 모델`을 사용
  * 내장 도큐먼트와 배열을 허용하여 복잡한 계층 관계를 하나의 레코드로 표현 가능
* 고정된 스키마가 없음
  * 필요할 때마다 쉽게 필드를 추가하거나 제거 가능

ℹ️ **확장 가능한 설계**

> 몽고DB는 `분산 확장`을 염두에 두고 설계

* 도큐먼트 지향 데이터 모델은 데이터를 여러 서버에 더 쉽게 분산
* 도큐먼트를 `자동으로 재분배`하고 사용자 요청을 올바른 장비에 `라우팅`하\`여 클러스터 내 데이터 **양과 부하 조절**

<figure><img src="/files/3d7QZtHRWZsnJxjlximR" alt=""><figcaption></figcaption></figure>

출처: <https://velog.io/@ha0kim/MongoDB-in-Action-12>

ℹ️ **다양한 기능**

> DBMS의 대부분의 기능과 더불어 아래와 같은 기능을 제공

* 인덱싱
* 집계
* 특수한 컬렉션 유형
* 파일 스토리지

ℹ️ **고성능**

> 몽고DB는 모든 측면에서 고성능을 유지하기 위해 설계

* 동시성과 처리량을 극대화하기 위해 `WiredTiger storage engine`에 `opportunistic locking`을 사용
* 캐시처럼 제한된 용량으로 램으로 쿼리에 알맞은 인덱스를 자동으로 선택

ℹ️ **몽고DB의 철학**

> 몽고DB 프로젝트의 주 관심사는 확장성이 높으며 유연하고 빠른
>
> 즉, 완전한 기능을 갖춘 데이터 스토리지를 만드는 일

## 몽고DB 기본

### 도큐먼트

> 몽고 DB의 핵심은 정렬된 키와 연결된 값의 집합으로 이뤄진 도큐먼트

* 도큐먼트의 키는 `문자열`
  * 몇 가지 예외(`\0`, `.`, `$`)를 제외하면 어떤 UTF-8 문자든 사용 가능
* `데이터형`과 `대소문자`를 구별
* `키 중복` 불가능

### 컬렉션

ℹ️ **동적 스키마**

> 컬렉션은 동적 스키마를 가지므로
>
> 하나의 컬렉션 내 도큐먼트들이 모두 다른 구조를 가질 수 있다.

ℹ️ **네이밍**

> 컬렉션은 이름으로 식별

* 아래를 제외한 어떤 UTF-8 문자열이든 사용 가능
  * `\0` (컬렉션명의 끝을 나타내는 문자)
  * `system.`으로 시작하는 컬렉션명 (예약어)
  * `$` (예약어)

ℹ️ **서브컬렉션**

> 서브컬렉션의 네임스페이스에 `.` 문자를 사용해 컬렉션을 쳬계화

* 단지 체계화를 위함이며 부모/자식 컬렉션과는 아무런 관계가 없음
* 특별한 속성은 없지만 여러 몽고DB 툴에서 지원
* 몽고DB 데이터를 체계화하는 훌륭한 방법

### 데이터베이스

> 몽고DB의 단일 인스턴스는 여러 데이터베이스를 호스팅할 수 있으며,
>
> 각 데이터베이스를 완전히 독립적으로 취급할 수 있다.

컬렉션과 마찬가지로 데이터베이스는 이름으로 식별된다.

데이터베이스 이름에는 아래 제약 조건을 제외하고 어떤 UTF-8 문자열이든 사용 가능하다.

* 빈 문자열
* `/, \, ., ' ', *, <, >, :, |, ?, $, , \0` 문자열 포함 불가
* 이름은 대소문자 구별
* 이름은 최대 64바이트

### 몽고DB 시작

서버를 시작하려면 원하는 유닉스 명령행 환경에서 mongod 실행 파일을 실행

* mongod는 인수 없이 실행 시 기본 데이터 디렉터리로 `/data/db`를 사용

```bash
$ mongod
```

### 셸 소개

> 명령행에서 몽고DB 인스턴스와 상호작용하는 자바스크립트 셸을 제공

**셸 실행**

* 셸은 완전한 자바스크립트 해석기이며 임의의 자바스크립트 프로그램을 실행

```bash
$ mongo

# docker 사용 시
$ docker run --name mongo -d -p 27017:27017 mongo
$ docker exec -it mongo mongosh
```

표준 자바스크립트 라이브러리의 모든 기능을 활용 가능

```bash
test> Math.sin(Math.PI / 2)
1

test> new Date("20109/1/1");
ISODate('+020109-01-01T00:00:00.000Z')
```

셸은 시작할 때 몽고DB 서버의 test 데이터베이스에 연결하고, 데이터베이스 연결을 전역 변수 db에 할당

* 셸에서는 주로 이 변수를 통해 몽고DB에 접근

  ```bash
  # 현재 db에 할당된 데이터베이스 확인
  test> db
  test

  # db 변수에서 컬렉션에 접근
  test> test.movies
  ```

### 셸 기본 작업

> 셸에서 생성, 읽기, 갱신, 삭제의 네 가지 기본적인 작업(CRUD) 제공

#### 생성

> `insertOne`

* 도큐먼트를 나타내는 자바스크립트 객체인 지역 변수를 생성

```sql
movie = {
    "title": "Star Wars: Episode IV - A New Hope",
    "director": "George Lucas",
    "year": 1977
}
db.movies.insertOne(movie)
```

#### 읽기

> `find`, `findOne`

```sql
db.movies.findOne()
```

* `find`, `findOne`은 쿼리 도큐먼트 형태로 조건 전달도 가능
* 쿼리에서 일치하는 도큐먼트로 결과를 제한

#### 갱신

> `updateOne`

```sql
db.movies.updateOne({"title": "Star Wars: Episode IV - A New Hope"},
    {$set : {reviews:[]}}
)
```

#### 삭제

> `deleteOne`, `deleteMany`

도큐먼트를 데이터베이스에서 영구적으로 삭제

* 필터와 일치하는 모든 도큐먼트 삭제 시 deleteMany 사용

```sql
db.movies.deleteOne({"title": "Star Wars: Episode IV - A New Hope"})
```

### 데이터형

> 몽고DB는 JSON의 키/값 쌍 성질을 유지하면서 추가적인 데이터형을 지원

ℹ️ **기본 데이터형**

> 가장 일반적인 데이터형

* **null**
* **boolean**
* **숫자**
  * 셸은 64비트 부동소수점 수를 기본으로 사용
  * 4바이트 혹은 8바이트 부호 정수는 각각 NumberInt, NumberLong 클래스를 사용
* **문자열**
  * 어떤 UTF-8 문자열이든 문자열형으로 표현
* **날짜**
  * 1970년 1월 1일부터의 시간을 1/1000초 단위로 나타내는 64비트 정수로 날짜를 저장
  * 표준 시간대는 저장하지 않음
* **정규 표현식**
  * 쿼리는 자바스크립트의 정규 표현식 문법 사용 가능
* **배열**
  * 값의 set, list를 배열로 표현 가능
* **내장 도큐먼트**
  * 부모 도큐먼트의 값으로 내장된 도큐먼트 전체를 포함 가능
* **객체 ID**
  * 객체 ID는 도큐먼트용 12바이트 ID

ℹ️ **날짜**

* 새로운 Date 객체 생성 시 항상 `Date()`가 아닌 `new Date()`를 호출해야 한다.
* 함수로 생성자를 호출(Date())하면 실제 Date 객체가 아닌 날짜의 문자열 표현을 반환
* 셸에서는 날짜가 현지 시간대 설정을 이용해 표시
  * 하지만, DB의 날짜는 1970년 1월 1일부터의 시간을 1/1000초 단위로 저장하여 표준 시간대 정보는 없음

ℹ️ **배열**

> 정렬 연산(list, stack, queue)), 비정렬 연산(set)에 호환성 있게 사용 가능

```sql
{"things" : ["pie", 3.14]}
```

* 배열은 서로 다른 데이터형을 값으로 포함 가능
* 도큐먼트 내 배열의 장점으로 몽고DB가 배열 구조를 `이해`하고, 배열의 내용에 작업을 수행하기 위해 내부에 도달하는 `방법`을 안다는 점
  * 따라서 배열에 쿼리하거나 배열의 내용을 이용해 인덱스 생성 가능

ℹ️ **내장 도큐먼트**

> 내장 도큐먼트를 사용해 데이터를 키/값 쌍의 평면적인 구조보다 자연스러운 방법으로 구성

```JSON
{
    "name": "Jone Doe",
    "address": {
        "street": "123 PArk Street",
        "city": "Anytown",
        "state": "NY"
    }
}
```

* 배열과 마찬가지로 내장 도큐먼트의 `구조를 이해`하고, `인덱스`를 구성하고, `쿼리`하며, `갱신`하기 위해 내장 도큐먼트 내부에 접근
* 내장 도큐먼트를 적절히 사용하면 좀 더 자연스럽게 정보 표현 가능
* 단, 몽고DB에서는 더 많은 데이터 반복이 생길 수 있다는 단점이 존재

#### \_id & ObjectId

> 몽고DB에 저장된 모든 도큐먼트는 `_id` 키를 가진다.

"\_id" 키 값은 어떤 데이터형이어도 상관없지만 "ObjectId"가 기본

**ObjectIds**

ObjectId는 "\_id"의 `기본 데이터형`이다.

* ObjectId 클래스는 가볍고, 여러 장비에 걸쳐 전역적으로 고유하게 생성하기 쉽게 설계
* ObjectId를 사용하는 주요 이유는 몽고DB의 분산 특성 때문
* 몽고DB는 분산 DB로 설계되어 샤딩된 환경에서 고유 식별자를 생성하는 것이 중요

ObjectId `12바이트`는 아래와 같이 생성

* **첫 4바이트**는 1970년 1월 1일부터의 시간을 1/1000초 단위로 저장하는 `타임 스탬프`
* **다음 5바이트**는 `랜덤 값`
* **최종 3바이트**는 서로 다른 시스템에서 충돌하는 아이디를 생성하지 않도록 랜덤 값으로 시작하는 `카운터`

```
(0 1  2 3) (4 5 6 7 8) (9 10 11)
타임스탬프    랜덤         카운터:랜덤 시작 값
```

* 앞 9바이트는 1초 동안 여러 장비와 프로세스에 걸쳐 유일성을 보장
* 마지막 3바이트는 단순히 증분하는 숫자로, 1초 내 단일 프로세스의 유일성을 보장
* 고유한 아이디는 프로세스당 1초에 256^3(1677만 7216)개까지 생성

**\_id 자동 생성**

* 도큐먼트를 입력할 때 "\_id" 키를 명시하지 않으면 입력된 도큐먼트에 키가 자동으로 추가

### 몽고DB 셸 사용

다른 장비나 포트에 mongod를 연결하려면 셸을 시작할 때 호스트명, 포트, DB를 명시해야 한다.

```bash
$ mongo some-host:30000/myDB
```

**셸 활용 팁**

* `help`: 셸에 내장된 도움말 확인
* `db.help`: 데이터베이스 수준의 도움말
* `db.foo.help()`: 컬렉션 수준의 도움말
* 함수의 기능을 알고 싶으면 함수명을 괄호 없이 입력

## 도규먼트 생성/갱신/삭제

### 삽입

> 도큐먼트를 삽입하려면 컬렉션의 `insertOne` 메서드 사용

```sql
db.movies.insertOne({"title": "Stand by Me",})
```

> 여러 도큐먼트를 컬렉션에 삽입하려면 `insertMany`로 도큐먼트 배열을 데이터베이스에 전달
>
> 도큐먼트를 대량 삽입하므로 효율적

```sql
db.movies.insertMany([{"title": "Ghostbusters"},
    {"title": "E.T."},
    {"title": "Blade Runner"}]);
```

`insertMany` 사용으로 대량 삽입 시 배열 중간에 있는 도규먼트에서 특정 유형의 오류가 발생할 경우, 정렬 연산을 선택했는지, 비정렬 연산을 선택했는지에 따라 발생하는 상황이 달라진다.

* 정렬된 삽입(기본값)
  * 옵션 도큐먼트 "ordered" 키에 true 지정
  * 삽입에 전달된 배열이 삽입 순서를 정의
  * 도큐먼트가 삽입 오류를 생성하면, 배열에서 이후 도큐먼트는 삽입되지 않는다.
* 정렬되지 않은 삽입
  * 옵션 도큐먼트 "ordered" 키에 false 지정
  * 몽고DB는 성능을 개선하려고 삽입을 재배열
  * 몽고DB는 일부 삽입의 오류 발생 여부에 관계없이 모든 도큐먼트 삽입을 시도

```sql
db.movies.insertMany([
    {"_id": 3, "title": "Sixteen Candles"},
    {"_id": 4, "title": "The Terminator"},
    {"_id": 4, "title": "The Princess Bride"},
    {"_id": 5, "title": "Scarface"},
])
```

{% hint style="info" %}
**대량쓰기 API**

몽고DB는 한 번의 호출로 여러 유형의 작업을 일괄 처리하는 대량 쓰기 API를 지원

[대량쓰기 API](https://www.mongodb.com/ko-kr/docs/languages/java/reactive-streams-driver/current/write/bulk-writes/) 참고
{% endhint %}

.

✅ **삽입 유효성 검사**

* 몽고DB는 삽입된 데이터에 최소한의 검사를 수행
  * "\_id" 필드가 존재하지 않으면 새로 추가하고, 모든 도큐먼트는 `16MB`보다 작어야 하므로 크기를 검사
* 대개 나쁜 스키마 설계를 예방하고 일관된 성능을 보장
  * doc라는 도큐먼트의 BSJON 크기를 보려면 쉘에서 `object.bsonsize(doc)`를 실행

### 삭제

> 데이터 삭제는 `deleteOne`, `deleteMany` 메서드 사용으로

```sql
db.movies.deleteOne({"_id": 4})
db.movies.deleteMany({"year": 1984})
```

* 👉🏻 `deleteOne`은 필터와 일치하는 `첫 번째 도큐먼트`를 삭제
  * 첫 번쨰의 기준은 삽입 순서, 갱신 상태, 인덱스 등 몇 가지 요인에 따라 달라진다.
* 👉🏻 `deleteMany`는 필터와 일치하는 모든 도큐먼트를 삭제

.

✅ **drop**

`deleteMany`를 사용해 모든 도큐먼트 제거

```sql
db.movies.deleteMany({})
```

전체 컬렉션 삭제 시 `drop`을 사용하는 편이 빠르다.

* 그리고 빈 컬렉션에 인덱스를 재생성

```sql
db.movies.drop()
```

### 갱신

> `updateOne`, `updateMany`, `replaceOne` 갱신 메서드

`updateOne`, `updateMany`는 필터 도큐먼트를 첫 번째 매개변수로, 변경 사항을 설명하는 수정자 도큐먼트를 두 번째 매개변수로 사용

`replaceOne`도 첫 번째 매개변수로 필터를 사용하지만, 두 번째 매개변수는 필터와 일치하는 도큐먼트를 교체할 도큐먼트

.

#### **도큐먼트 치환**

> `replaceOne`은 도큐먼트를 새로운 것으로 치환

⭐️ 대대적인 스키마 마이그레이션에 유용

```sql
db.users.insertOne({
    "name": "joe",
    "friends": 32,
    "enemies": 2
})

// friend, enemies 필드를 relationships 라는 서브도큐먼트로 이동
var joe = db.users.findOne({"_id": ObjectId("672c2c8f07b2c3060aa45bc2")})
joe.relationships = {"friends": joe.friends, "enemies": joe.enemies};
joe.username = joe.name;
delete joe.friends;
delete joe.enemies;
delete joe.name;
db.users.replaceOne({"name": "joe"}, joe)
```

.

#### **갱신 연산자**

> 부분 갱신에는 원자적 갱신 연산자를 사용

⭐️ 갱신 연산자는 키를 변경, 추가, 제거하고, 배열과 내장 도큐먼트를 조작하는 복잡한 갱신 연산을 지정하는데 사용하는 특수키

👉🏻 **"$inc"**

```sql
db.analytics.insertOne({
    "url": "www.example.com",
    "pageviews": 52
})
// 페이지 방문 시 URL로 페이지를 찾고, pageviews 증가
db.analytics.updateOne({"url": "www.example.com"},
    {"$inc": {"pageviews": 1}})
```

👉🏻 **"$set"**

* `$set`은 필드 값을 설정
* 필드가 존재하지 않으면 새 필드가 생성
* 스키마를 갱신하거나 사용자 정의 키를 추가할 때 편리
* `$set`은 key의 데이터형도 변경 가능
* `$unset`으로 key/value 모두 제거 가능

```sql
db.users.insertOne({
    "name": "joe",
    "age": 30,
    "sex": "male",
    "location": "Wisconsin"
});
db.users.updateOne({"_id": ObjectId("672c304b07b2c3060aa45bc6")},
    {"$set": {"favorite book": "War and Pace"}});
db.users.updateOne({"_id": ObjectId("672c304b07b2c3060aa45bc6")},
    {"$unset": {"favorite book": 1}})
```

{% hint style="info" %}
키를 추가, 변경, 삭제할 때는 항상 `$` 제한자를 사용해야 한다.
{% endhint %}

👉🏻 **증가와 감소**

> `$inc` 연산자는 이미 존재하는 키의 값을 변경하거나 새 키를 생헝하는 데 사용

⭐️ 분석, 분위기, 투표 등과 같이 자주 변하는 수치 값을 갱신하는 데 유용

```sql
db.games.insertOne({"game": "pinball", "user": "joe"})

db.games.updateOne({"game": "pinball", "user": "joe"},
    {"$inc": {"score": 50}})
```

`$inc`는 `$set`과 비슷하지만 숫자를 증감하기 위해 설계

* int, long, double, decimal 타입 값에만 사용 가능
* 또한, `$inc`의 키 값은 무조건 숫자
* 다른 데이터형을 반환하려면 `$set`이나 배열 연산자 사용

👉🏻 **배열 연산자**

> 배열을 이루는 데 갱신 연산자 사용 가능

연산자는 리스트에 대한 인덱스를 지정할 수 있을 뿐 아니라 셋처럼 이중으로 사용 가능

1️⃣ **요소 추가**

* `$push`는 배열이 이미 존재하면 배열 긑에 요소를 추가하고, 존재하지 않으면 새로운 배열을 생성

```sql
db.blog.posts.insertOne({"title": "A blog post", "content": "..."})
db.blog.posts.updateOne({"title": "A blog post"},
    {
        "$push": {
            "comments":
                {
                    "name": "joe", "email": "joe@example.com",
                    "comtent": "nice post."
                }
        }
    })
```

`$push`에 `$each` 제한자를 사용하면 작업 한 번으로 값을 여러 개 추가할 수 있다.

```sql
// 배열에 새로운 요소 세 개 추가
db.stock.ticker.updateOne({"id": "GOOG"},
    {"$push": {"hourly": {"$each": [562.776, 562.790, 559.123]}}})
```

배열을 특정 길이로 늘이려면 `$slice`를 `$push`와 결합해 사용

* 배열이 특정 크기 이상으로 늘어나지 않게 하고 효과적으로 'top N' 목룍을 만들 수 있음
* 아래 예제는 배열에 추가할 수 있는 요소의 개수를 10개로 제한
  * 10보다 크면 마지막 10개 요소만 유지
  * `$slice`는 도큐먼트 내에 큐를 생성하는 데 사용

```sql
db.movies.updateOne({"genre": "horror"},
    {
        "$push": {
            "top10": {
                "$each": ["Nightmare on Elm Street", "Saw"],
                "$slice": -10
            }
        }
    })
```

trimming 하기 전 `$sort` 제한자를 `$push` 작업에 적용 가능

* rating 필드로 배열의 모든 요소를 정렬한 후 처음 10개의 요소를 유지
* `$each`를 반드시 포함
* `$slice`나 `$sort`를 배열상에서 `$push`와 함께 쓰려면 반드시 `$each`도 사용

```sql
db.movies.updateOne({"genre": "horror"},
    {
        "$push": {
            "top10": {
                "$each": [{
                    "name": "Nightmare on Elm Street",
                    "rating": 6.6
                },
                    {"name": "Saw", "rating": 4.3}],
                "$slice": -10,
                "$sort": {"rating": -1}
            }
        }
    })
```

2️⃣ 배열을 집합으로 사용하기

* 특정 값이 배열에 존재하지 않을 때 해당 값을 추가하면서, 배열을 집합처럼 처리하려면 쿼리 도큐먼트에 `$ne`를 사용

```sql
# 인용 목록에 저자가 존재하지 않을 경우에만 해당 저자 추가
db.papers.updateOne({"authors cited": {"$ne": "Richie"}},
    {$push: {"authors cited": "Richie"}})
```

`$addToSet`은 `$ne`가 동작하지 않을 경우 사용 가능하고, 중복을 피할 수 있다.

```sql
db.users.updateOne({"_id": ObjectId("672ca876ccf8f87e8793c90a")},
    {"$addToSet": {"emails": "joe@gmail.com"}})
```

고유한 값을 여러 개 추가하려면 `$addToSet`과 `$each`를 결합하여 사용

```sql
db.users.updateOne({"_id": ObjectId("672ca876ccf8f87e8793c90a")},
    {
        "$addToSet": {
            "emails": {
                "$each":
                    ["joe@gmail.com", "joe@python.org"]
            }
        }
    })
```

3️⃣ 요소 제거하기

* 배열을 큐나 스택처럼 사용하려면 배열의 양쪽 끝에서 요소를 제거하는 `$pop`을 사용
  * `{"$pop" : {"key" : 1}}`은 배열의 마지막 요소부터 제거
  * `{"$pop" : {"key" : -1}}`은 배열의 처음 요소부터 제거
* `$poll`은 주어진 조건에 맞는 배열 요소를 제거하는 데 사용

4️⃣ 배열의 위치 기반 변경

* 몽고DB에서는 쿼리 도큐먼트와 일치하는 배열 요소 및 요소의 위치를 알아내서 갱신하는 위치 연산자 `$`를 제공
* 위치 연산자는 **첫 번쨰로 일치하는** 요소만 갱신

```sql
// John이라는 사용자가 이름을 Jim으로 갱신 시, 위치 연산자를 사용해 댓글 내 해당 항목을 갱신
db.blog.updateOne({"comments.author": "John"},
    {"$set": {"comments.$.author": "Jim"}})
```

.

#### **갱신 입력**

> 갱신 입력은 특수한 형태를 갖는 갱신

* 갱신 조건에 맞는 도큐먼트가 존재하지 않을 때는 쿼리 도큐먼트와 갱신 도큐먼트를 합쳐서 새로운 도큐먼트를 생성
* `updateOne`과 `updateMany`의 세 번째 매개변수는 옵션 도큐먼트로, 갱신 입력을 지정

```sql
db.analytics.updateOne({"url": "/blog"}, {"$inc": {"pageviews": 1}}, {"upsert": true})
```

`$setOnInsert`는 도큐먼트가 삽입될 때 필드 값을 설정하는 데만 사용하는 연산자

```sql
db.users.updateOne({}, {"$setOnInsert": {"createdAt": new Date()}},
    {"upsert": true})
```

{% hint style="info" %}
ObjectId가 도큐먼트가 작성된 때의 타임스탬프를 포함하므로 일반적으로 createdAt가 반드시 필요하지 않음

하지만, `$setOnInsert`는 패딩을 생성하고 카운터를 초기화하는 데 쓰이면, ObjectId를 사용하지 않는 컬렉션에 유용
{% endhint %}

👉🏻 **지정 셸 보조자**

> `save`는 도큐먼트가 존재하지 않으면 도큐먼트를 삽입하고, 존재하면 도큐먼트를 갱신

개발자가 셸에서 도큐먼트를 빠르게 수정하게 해주는 편리한 함수

```bash
> var x = db.testcol.findOne()
> x.num = 42
> db.testcol.save(x)
```

.

#### **다중 도큐먼트 갱신**

`updateOne`은 필터 조건에 맞는 첫 번째 도큐먼트만 갱신하므로, 조건에 맞는 도큐먼트를 모두 수정하려면 `updateMany`를 사용하자.

* `updateMany`는 스키마를 변경하거나 특정 사용자에 새로운 정보를 추가할 때 쓰기 좋다. .

#### **갱신한 도큐먼트 반환**

> `findOnAndDelete`, `findOneAndReplace`, `findOneAndUpdate`를 셸에 도입

`updateOne`과의 주요 차이점은 사용자가 수정된 도큐먼트의 값을 원자적으로 얻을 수 있다.

{% hint style="info" %}
몽고DB 4.2는 갱신을 위한 집계 파이프라인을 수용하도록 `findOneAndUpdate`를 확장했다.

파이프라인은 $addFields($set), $project($unset), $replaceRoot($replaceWith)로 구성
{% endhint %}

일반적인 프로세스는 경쟁 상태를 만들 수 있는데 `findOnAndUpdate`는 한 번의 연산으로 항목을 반환하고 갱신할 수 있다.

```sql
db.process.findOneAndUpdate({"status": "READY"},
    {"$set": {"status": "RUNNING"}},
    {"sort": {"priority": -1}})
```

옵션 도큐먼트의 `returnNewDocument` 필드를 true로 설정하면 **갱신된 도큐먼트를 반환**

* 옵션 도큐먼트는 `findOneAndUpdate`의 세 번째 매개변수로 전달\`

```sql
db.process.findOneAndUpdate({"status": "READY"},
    {"$set": {"status": "RUNNING"}},
    {
        "sort": {"priority": -1},
        "returnNewDocument": true
    })
```

이외에도 `findOneAndReplace`는 동일한 매개변수를 사용하며,

* `returnNewDocument`의 값에 따라 교체 전이나 후에 필터와 일치하는 도큐먼트를 반환
* `findOneAndDelete`는 삭제된 도큐먼트를 반환

## 쿼리

### find

```sql
// 컬렉션 내 모든 도큐먼트
db.c.find()

// age가 27인 모든 도큐먼트
db.users.find({"age": 27})

// username 키 값이 joe인 도큐먼트
db.users.find({"username": "joe"})

// 27살이면서 이름이 joe인 모든 사용자
db.users.find({"username": "joe", "age": 27})
```

1️⃣ 반환받을 키 지정

> find의 두 번째 매개변수에 원하는 키를 지정

* 네트워크상의 데이터 전송량과 클라이언트 측에서 도큐먼트를 디코딩하는 데 드는 시간과 메모리 단축

```sql
// username, email 키의 값만 원할 경우
db.users.find({}, {"username": 1, "email": 1})

// 두 번째 매개변수를 사용해서 특정 키/값 쌍을 제외한 결과
db.users.find({}, {"fatal_weakness": 0})

// "_id" 반환 제외
db.users.find({}, {"username": 1, "_id": 0})
```

### 쿼리 조건

1️⃣ 쿼리 조건절

> <, <=, >, >=
>
> "$lt", "$lte", "$gt", "$gte"

```sql
// 18세에서 30세 사이의 사용자
db.users.find({"age": {"$gte": 18, "$lte": 30}})

// 2007년 1월 1일 이전에 등록한 사람
start = new Date("01/01/2007")
db.users.find({"registered": {"$lt": start}})
```

* 날짜는 1/1000초 단위로 저장되므로 정확히 일치시키는 조건은 그리 유용하지 않다.
* 하루, 한 주, 한 달 단위가 필요한 경우가 많으므로 범위 쿼리를 사용

키 값이 특정 값과 일치하지 않는 도큐먼트를 찾을 때는 `$ne`를 사용

```sql
// 사용자명이 joe가 아닌 사용자
db.users.find({"username": {"$ne": "joe"}})
```

2️⃣ OR 쿼리

OR 쿼리에는 두 가지 방법이 존재

* `$in`은 하나의 키를 다양한 값과 비교
* `$or`은 더 일반적이며, 여러 키를 주어진 값과 비교하는 쿼리에 사용

```sql
db.reffle.find({"ticket_no": {"$in": [725, 542, 390]}})

// 두 조건 중 하나라도 맞는 도큐먼트를 찾도록 쿼리
db.users.find({"user_id": {"$in": [12345, "joe"]}})

// 배열 내 조건과 일치하지 않는 도큐먼트 반환
db.reffle.find({"ticket_no": {"$nin": [725, 542, 390]}})

// "$or"은 다른 조건절도 포함
db.reffle.find({
    "$or": [{"ticket_no": {"$in": [725, 542, 390]}},
        {"winner": true}]
})
```

{% hint style="info" %}
"$or" 연산자가 항상 작동하는 동안에는 가능한 한 "$in"을 사용하자.

쿼리 옵티마이저는 "$in"을 더 효율적으로 다룬다.
{% endhint %}

3️⃣ `$not`

"`$not`"은 정규 표현식과 함께 사용해 주어진 패턴과 일치하지 않는 도큐먼트를 찾을 때 특히 유용

```sql
db.users.find({"id_num": {"$not": {"$mod": [5, 1]}}})
```

### 형 특정 쿼리

1️⃣ null

null은 '존재하지 않음'과도 일치

* 키가 null인 값을 쿼리하면 해당 키를 갖지 않는 도큐먼트도 반환

```sql
db.c.find({"z": null})
```

값이 null인 키만 찾고 싶다면, 키가 null인 값을 쿼리하고, "`$exists`" 조건절을 사용해 null 존재 여부를 확인

```sql
db.c.find({"z": {"$eq": null, "$exists": true}})
```

2️⃣ 정규 표현식

"`$regex`"는 쿼리에서 패턴 일치 문자열을 위한 정규식 기능을 제공

```sql
// 이름이 Joe나 joe인 사용자
db.users.find({"name": {"$regex": /joe/i}})

// joe 뿐만 아니라 joey도 
db.users.find({"name": /joey?/i})
```

3️⃣ 배열에 쿼리하기

> 배열 요소 쿼리는 스칼라 쿼리와 같은 방식으로 동작하도록 설계

```sql
db.food.insertOne({"fruit": ["apple", "banana", "peach"]})

db.food.find({"fruit": "banana"})
```

.

"`$all`" 연산자

* 두 개 이상의 배열 요소가 일치하는 배열을 찾으려면 `$all` 사용

```sql
db.food.find({fruit: {$all: ["apple", "banana"]}})

// 전체 배열과 정확하게 일치하는 도큐먼트 쿼리
db.food.find({"fruit": ["apple", "banana", "peach"]})
```

배열 내 특정 요소를 쿼리하려면 `key.index` 구문을 사용해 순서를 지정

* 세 번째 요소와 "peach" 문자열이 일치하는지 확인

```sql
db.food.find({"fruit.2": "peach"})
```

.

"`$size`" 연산자

* `$size`는 특정 크기의 배열을 쿼리하는 유용한 조건절

```sql
db.food.find({"find": {"$size": 3}})
```

`$size`는 다른 $ 조건절과 결합해 사용할 수 없지만, 도큐먼트에 "size" 키를 추가하면 이런 쿼리를 처리 가능

* 배열에 요소를 추가할 때마다 "size" 값을 증가

```sql
db.food.updateOne({"push": {"fruit": "strawberry"}, "$inc": {"size": 1}})
```

값의 증가는 매우 빠르게 이루어지므로 성능은 걱정할 필요가 없다.

* 도큐먼트를 저장하고 나면 아래 쿼리가 가능
* eks, "`$addToSet`" 연산자와는 사용 불가

```sql
db.food.find({"size": {"$gt": 3}})
```

.

"`$slice`" 연산자

* 배열 요소의 부분집합을 반환
* 배열 요소의 인덱스를 알고 있다면 유용하지만, 특정 기준과 일치하는 배열 요소를 원할 경우 `$` 연산자 사용

```sql
// 각 도큐먼트에서 첫 번째로 일치하는 댓글만 반환
db.blog.posts.find({"comments.name": "bob"}, {"comments.$": 1})
```

4️⃣ 내장 도큐먼트에 쿼리하기

내장 도큐먼트에 쿼리할 때는 가능하다면 특정 키로 쿼리하는 방법이 좋다.

* 도큐먼트 전체를 대상으로 정확히 일치시키는 방법이 아니므로 스키마가 변경되더라도 모든 쿼리가 정상적으로 작동
* 내장 도큐먼트의 키를 쿼리할 때는 점 표기법을 사용

```sql
db.people.find({"name.first": "Joe", "name.last": "Schmoe"})
```

모든 키를 지정하지 않고도 조건을 정확하게 묶으려면 "`$elemMatch`"를 사용

* 조건을 부분적으로 지정해 배열 내에서 하나의 내장 도큐먼트를 찾게 해준다.
* "$elemMatch"를 사용해 조건을 그룹화할 수 있다.
* 내장 도큐먼트에서 두 개 이상의 키의 조건 일치 여부를 확인할 때만 필요

```sql
db.blog.find({
    "comments": {
        "$elemMatch":
            {"author": "joe", "source": {"$gte": 5}}
    }
})
```

### $where 쿼리

"`$where`" 절을 사용해 임의의 자바스크립트를 쿼리의 일부분으로 실행하면 (거의) 모든 쿼리를 표현 가능

* 도큐먼트 내 두 키의 값을 비교하는 쿼리에 가장 자주 사용
* 일반 쿼리보다 훨씬 느리니 반드시 필요한 경우가 아니면 사용하지 말자.
* 몽고DB 3.6에 쿼리 언어로 집계 표현식을 사용할 수 있는 `$expr`을 사용하자
  * 자바스크립트를 실행하지 않아 더 빠른 쿼리

### 커서

> 데이터베이스는 커서를 사용해 find의 결과를 반환

셸에서 커서를 생성하려면 컬렉션에 도큐먼트를 집어넣고 쿼리한 후 결과를 지역 변수에 할당

* 결과를 한 번에 하나씩 볼 수 있다는 장점
* 결과를 얻으려면 커서의 next 메서드를 사용하고, 다른 결과가 있는지 확인하려면 hasNext 사용

```bash
> var cursor = db.collection.find()

> while (cursor.hasNext()) {
    obj = cursor.next()
    // ...
  }
```

cursor 클래스는 자바스크립트 반복자 인터페이스를 구현해서 forEach 반복문에 사용 가능

```bash
> var cursor = db.people.find();
> cursor.forEach(function(x)) {
    print(x.name);
  };
```

1️⃣ 제한, 건너뛰기, 정렬

결과 개수를 제한하려면 find 호출에 `limit` 함수를 연결

* N개의 결과만 반환

```sql
db.c.find().limit(3)
```

`skip`은 `limit`와 유사하게 동작

* 조건에 맞는 결과 중 처음 N개를 건너뛴 나머지를 반환

```sql
db.c.find().skip(3)
```

`sort`는 객체를 매개변수로 받는다.

```sql
// "username"은 오름차순으로, "age"는 내림차순으로 정렬
db.c.find().sort({username : 1, age : -1})

// 가격을 내림차순으로 정렬해 한 페이지당 50개씩 결과를 보이기
db.stock.find({"desc": "mp3"}).limit(50).sort({"price": -1})

// 다음 페이지를 클릭하면 더 많은 결과가 보이도록
db.stock.find({"desc": "mp3"}).limit(50).skip(50).sort({"price": -1})
```

⚠️ 하지만.. 큰 수를 건너뛰면 비효율적

.

**비교 순서**

데이터형이 섞여 있는 키는 미리 정의된 순서에 따라 정렬

* 최솟값
* null
* 숫자(int, long, double, decimal)
* 문자열
* 객체/도큐먼트
* 배열
* 이진 데이터
* 객체 ID
* 불리언
* 날짜
* 타임스템프
* 정규 표현식
* 최댓값

2️⃣ 많은 수의 건너뛰기 피하기

> 도큐먼트 수가 적을 때는 skip을 사용해도 무리가 없지만, skip은 생략된 결과물을 모두 찾아 폐기하므로 결과가 많으면 느려진다.
>
> 대부분의 데이터베이스틑 skip을 위해 인덱스 안에 메타데이터를 저장하지만 몽고DB는 아직 해당 기능을 지원하지 않는다.
>
> 따라서 많은 수의 건너뛰기는 피해야 한다.

**skip을 사용하지 않고 페이지 나누기**

* 쿼리에 따라 skip을 사용하지 않는 방법을 찾을 수 있다.
* 예를 들어 "date"를 내림차순으로 정렬해 도큐먼트를 표시할 경우

```sql
var page1 = db.foo.find().sort({"date": -1}).limit(100)

// 마지막 도큐먼트의 "date" 값을 사용해 다음 페이지를 가져온다.
var latest = null;

// 첫 페이지 보여주기
while(page1.hasNext()) {
    latest = page1.next()
    display(latest);
}

// 다음 페이지 가져오기
var page2 = db.foo.find({"date" : {"$lt" : latest.date}});
page2.sort({"date" : -1}).limit(100)
```


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://jihunparkme.gitbook.io/docs/book/mongo-db-guide/mongo-db-start.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.