# 0. Google dorking/hacking

Giai đoạn đầu tiên của kiểm toán máy tính của bất kỳ hệ thống thông tin nào bắt đầu bằng việc thu thập lượng thông tin tối đa về mục tiêu.

Dữ liệu phải được thu thập từ nhiều nơi khác nhau: (database, code html, nguồn tin tức,...) để tạo ra một bức tranh toàn cảnh hoàn chỉnh hệ thống thông tin của tổ chức, như thể từ các mảnh ghép hình.

Chúng ta đã chia quy trình thu thập thông tin thành các bước:

* Tìm kiếm trong các nguồn mở
* Thu thập thông tin cơ bản
* Thu thập thông tin mạng
* Tìm kiếm các host đang hoạt động
* Tìm kiếm các port đang mở
* Định nghĩa tài sản cố định
* Xác định các dịch vụ
* Xây dựng sơ đồ mạng

### Chúng ta sẽ tìm kiếm gì?

* *Domain (tên miền)* - là địa chỉ website trên internet thuộc sở hữu của tổ chức.
* *Địa chỉ mạng và khối mạng* - là các địa chỉ IP hoặc dải địa chỉ IO
* *Địa điểm* - là địa chỉ vật lý của tổ chức, nơi đặt trụ sở, văn phòng hoặc các cơ sở khác của tổ chức.
* *Thông tin liên hệ*: bao gồm các phương thức liên lạc với chức, chẳng hạn như số điện thoại, email, fax, và thông tin liên hệ của các cá nhân chịu trách nhiệm.
* *Tin tức về sáp nhập hoặc mua lại*
* *Tuyển dụng*
* *Liên kết tới các dịch vụ web liên quan đến tổ chức* - là các liên kết đến các trang web hoặc dịch vụ trực tuyến khác liên quan đến tổ chức, ví dụ như trang mạng xã hội chính thức, cổng thông tin khách hàng, hoặc các trang web đối tác.
* *Các tài liệu khác nhau* - gồm các tài liệu pháp lý, báo cáo hàng năm, tài liệu thuyết trình, hướng dẫn, chính sách công ty, và các tài liệu khác mà tổ chức công khai.
* *Cơ cấu tổ chức* - mô tả về hệ thống phân cấp nội bộ của tổ chức, các phòng ban, bộ phận, và các  cá nhân chủ chốt nắm giữ các vị trí quan trọng.

Kẻ tấn công hoặc kiểm toán viên có thể sử dụng không chỉ Google, mà còn cả Yahoo hoặc bất kỳ dịch vụ tìm kiếm nào khác để thu thập thông tin.

1. &#x20; (dấu cách)- Tương đương với logic "VÀ", tức là tìm kiếm tất cả các từ được ngăn cách bởi dấu cách. Google sẽ hiển thị các kết quả chứa tất cả những từ này.
2. `OR` - Tương đương với logic "HOẶC", cho phép tìm kiếm các kết quả có chứa một trong những từ hoặc cụm từ được liệt kê. Ký hiệu thay thế cho "OR" là dấu gạch đứng `|`.
3. `+` (Dấu cộng) – Dấu cộng buộc Google phải đưa từ đứng sau dấu cộng vào kết quả tìm kiếm. Nghĩa là từ đó bắt buộc phải xuất hiện trong các kết quả.
4. `-`(Dấu trừ) – Tương đương với logic "KHÔNG", yêu cầu Google loại bỏ những kết quả có chứa từ đứng sau dấu trừ.
5. `""` (Dấu ngoặc kép) – Đưa từ hoặc cụm từ vào trong dấu ngoặc kép để tìm chính xác cụm từ đó, không có biến thể nào khác.
6. `~` (Dấu ngã) – Dấu này yêu cầu Google tìm kiếm không chỉ từ được chỉ định mà còn cả các từ đồng nghĩa với từ đó.
7. `*`– Dấu sao có thể thay thế cho một từ bất kỳ trong chuỗi tìm kiếm. Nó cho phép tìm kiếm với nhiều biến thể khác nhau giữa các từ đã xác định.
8. `..` (Hai dấu chấm) – Sử dụng hai dấu chấm để tìm kiếm trong một khoảng giá trị số. Ví dụ, tìm kiếm các kết quả trong phạm vi từ số này đến số kia.
9. **`filetype:`** – Cho phép bạn chỉ định loại tệp cần tìm kiếm. Ví dụ: `filetype:pdf` sẽ tìm kiếm các tệp PDF chứa từ khóa bạn nhập.
10. **`site:`** – Giới hạn tìm kiếm trên một trang web hoặc tên miền cụ thể. Ví dụ: `site:example.com` sẽ chỉ tìm kiếm trong trang web `example.com`.
11. **`movie:`** – Toán tử dùng để tìm kiếm thông tin liên quan đến phim điện ảnh. Ví dụ: `movie:Inception` sẽ hiển thị thông tin về bộ phim *Inception*.
12. **`daterange:`** – Tìm kiếm các trang web được lập chỉ mục trong một khoảng thời gian nhất định, sử dụng **Julian Day Number** (một hệ thống ngày cụ thể). Bạn cần sử dụng công cụ chuyển đổi để xác định số ngày Julian.
13. **`safesearch:`** – Cho phép kích hoạt chế độ tìm kiếm an toàn, loại bỏ các kết quả chứa nội dung không phù hợp như nội dung người lớn.
14. **`allintitle:`** – Tìm kiếm các trang mà tất cả các từ khóa đều xuất hiện trong tiêu đề của trang. Ví dụ: `allintitle: học lập trình Python` sẽ trả về các trang có tiêu đề chứa các từ "học", "lập trình", và "Python".
15. **`intitle:`** – Tìm kiếm trang có từ khóa đầu tiên trong tiêu đề và các từ còn lại có thể xuất hiện ở bất kỳ đâu trên trang. Ví dụ: `intitle:Python lập trình` sẽ trả về các trang có tiêu đề chứa "Python" và từ "lập trình" có thể ở bất kỳ đâu trong nội dung.
16. **allinurl:** – Tìm kiếm các trang mà tất cả các từ khóa xuất hiện trong URL. Ví dụ: `allinurl:python học` sẽ trả về các trang có URL chứa cả hai từ "python" và "học".
17. **inurl:** – Tương tự như `allinurl`, nhưng chỉ tìm kiếm một từ khóa trong URL. Ví dụ: `inurl:python` sẽ trả về các trang có URL chứa từ "python".
18. **allintext:** – Tìm kiếm các từ khóa chỉ trong nội dung văn bản của trang, bỏ qua tiêu đề, URL và các liên kết. Ví dụ: `allintext:học lập trình Python` sẽ chỉ tìm kiếm trong phần văn bản của các trang.
19. **intext:** – Tương tự như `allintext`, nhưng chỉ tìm kiếm một từ khóa trong nội dung văn bản. Ví dụ: `intext:Python` sẽ tìm kiếm các trang có chứa từ "Python" trong nội dung văn bản.
20. **allinanchor:** – Tìm kiếm các từ khóa trong văn bản của các liên kết trên trang. Tất cả các từ phải có trong văn bản liên kết.
21. **inanchor:** – Tương tự như `allinanchor`, nhưng chỉ tìm kiếm một từ khóa trong văn bản của các liên kết.
22. **define:** – Hiển thị các trang chứa định nghĩa của từ khóa bạn tìm kiếm. Ví dụ: `define:AI` sẽ trả về các trang định nghĩa về "AI".
23. **related:** – Tìm kiếm các trang web có nội dung tương tự với trang web bạn chỉ định. Ví dụ: `related:example.com` sẽ hiển thị các trang có nội dung tương tự với `example.com`.
24. **info:** – Hiển thị thông tin về một trang web, bao gồm các liên kết đến phiên bản lưu trữ và các trang khác có liên quan đến trang web đó.
25. **cache:** – Hiển thị phiên bản được lưu trong bộ nhớ đệm của Google cho một trang web. Ví dụ: `cache:example.com` sẽ hiển thị phiên bản lưu trữ của trang `example.com`.
26. **link:** – Tìm kiếm tất cả các trang web có chứa liên kết đến một trang mà bạn nhập. Ví dụ: `link:example.com` sẽ hiển thị các trang web có liên kết đến `example.com`.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://viettaliii.gitbook.io/home/education/other/0.-google-dorking-hacking.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
