Chúng
ta đều nghe mọi chuyện về nội dung sao chép và hầu hết những người quản
trị web đều biết đó là một điều rất dở khi dùng cho một trang web.
Nhưng chính xác thì nó là gì và tại sao điều đó lại là tồi tệ?Đúng
như cái tên của nó, nội dung sao chép ám chỉ việc nội dung tương tự đã
xuất hiện trước đó trên mạng, một bài báo hay một đoạn văn bản giống y
hệt một bài báo hay đoạn văn bản đã có trên một trang web khác. Các từ
ngữ giống nhau theo một trật tự giống nhau với hầu hết các dấu chấm câu
không khác nhau.
Về cơ bản, đó là nội
dung bị trộm cắp. Nội dung được người khác viết và được sử dụng trên
trang web của kẻ đánh cắp. Nội dung đó bị đánh cắp bởi một người quản
trị web không có kỹ năng viết nổi một bài viết độc đáo hoặc thường bị
trộm cắp bởi một người quản trị web lười biếng.
Nội dung sao chép
không được các công cụ hỗ trợ tìm kiếm tán thành, cho nên chúng sẽ bị
trừng phạt. Một website có một trang về cơ bản bị các công cụ hỗ trợ
tìm kiếm liệt vào dạng nội dung xâm phạm tác quyền sẽ bị xếp ở vị trí
thấp hơn trong SERPS (trang kết quả tìm kiếm của các công cụ hỗ trợ tìm
kiếm) hoặc tồi tệ hơn, sẽ bị chặn lại theo chủ ý của công cụ hỗ trợ tìm
kiếm. Bất cứ ai sử dụng SEO để đạt được một thứ hạng cao trong kết quả
tìm kiếm với nội dung ăn cắp là đều đang tự lừa gạt lại chính bản thân
mình. Một vị trí cao trong SERPS là điều không thể đối với nội dung
trộm cắp trên website. Đó là điều chắc chắn sẽ không xảy ra.
Tuy nhiên, có một
cách để một bài báo gốc được trình bày trên một website khác được coi
là hiển thị một cách hợp pháp trên website đó mà không vướng phải sự
trừng phạt của công cụ hỗ trợ tìm kiếm. Đây là một phương pháp mà tôi
sử dụng để bổ sung thêm tính chuyên nghiệp cho một trong những website
của tôi.
Site này quảng bá
cho một sản phẩm ngăn chặn sự béo phì và bao gồm các trang thu thập tin
tức về sự béo phì từ khắp nơi trên thế giới. Tôi giữ trang này luôn cập
nhật với các bản tin mới nhất và thường bao gồm từ 4 đến 6 mục tin trên
mỗi trang.
Tôi thường tìm kiếm
trên internet những tin tức mới nhất về bất cứ thứ gì liên quan đến sự
béo phì, dù là sáng kiến của chính quyền, nghiên cứu của các viện y
học, hay những câu chuyện cá nhân. Nội dung này được sao chép và nó
không bị giả mạo hay bị sửa đổi. Tôi thử kể cả toàn bộ nội dung ở bất
cứ nơi nào có thể. Nhưng nếu bài viết quá dài, tôi có thể sao chép chỉ
một vài đoạn văn bản đầu tiên nhưng đảm bảo rằng tôi vẫn giữ chủ đề
chung của chuyên mục.
Vậy thì làm thế nào để tôi có thể tuân thủ các quy tắc về nội dung sao chép của các công cụ hỗ trợ tìm kiếm?
Tôi lấy toàn bộ
thông tin về bài viết, kể cả tiêu đề, vị trí mà tôi tìm thấy mục tin
kèm theo ngày tháng. Do vậy nếu tôi thấy một mục về một bài phát biểu
của bộ trưởng y tế Canada về chủ đề béo phì với trẻ em đang đi học ở
Canada, tôi sẽ sao chép nguyên gốc bài viết mà không có bất cứ sự chỉnh
sửa cùng với tiêu đề gốc, ngày tháng và tên của nguồn tin, ví dụ như
Toronto Mail and Globe hay Reuters. Tất cả các thông tin này đều xuất
hiện trên trang web của tôi.
Thực ra, những gì
tôi đang làm là nói với các công cụ hỗ trợ tìm kiếm rằng thể theo mong
muốn của công chúng, tôi đang thông tin cho họ về những tiến bộ mới
nhất trong cuộc chiến với bệnh béo phì. Các công cụ hỗ trợ tìm kiếm
buộc phải nhận ra rằng thông tin này chỉ củng cố cho website của tôi
như một nguồn cung cấp thông tin có thẩm quyền về những tin tức liên
quan đến sự béo phì. Thế làm thế nào để tôi biết rằng các công cụ hỗ
trợ tìm kiếm nhìn nhận thân thiện nội dung được sao chép của tôi? Bởi
thỉnh thoảng các trang web của tôi có nội dung này lại giành được một
vị trí tốt trên SERPS.
Tương tự như vậy,
những người quản trị web có được nội dung từ các site đưa bài viết đang
làm hại chính họ nếu không chịu tuân theo các quy tắc của nhà xuất bản
web đã đặt ra: bài viết phải được sao chép toàn bộ mà không có bất cứ
thay đổi nào: tất cả các đường link phải được giữ nguyên si; thông tin
của tác giả phải được hiển thị mà không chỉnh sửa; và đường link của
các site đưa bài viết phải được giữ nguyên. Nếu những hướng dẫn này
được tôn trọng triệt để thì người sao chép nội dung nguyên bản sẽ không
phải gánh chịu bất cứ sự trừng phạt về nội dung sao chép của các công
cụ hỗ trợ tìm kiếm.
Tuy nhiên, nếu những
hướng dẫn của nhà xuất bản bị lờ đi, ví dụ: thông tin của tác giả trong
các đường link của các những site đăng bài bị bỏ qua, thì các công cụ
hỗ trợ tìm kiếm sẽ không chỉ phạt riêng trang đó mà là toàn bộ cả site
đó. Bởi vì các công cụ hỗ trợ tìm kiếm sẽ kết luận là toàn bộ site đó
đã tham gia vào việc sử dụng nội dung sao chép.
Tuy vậy, quy tắc cơ
bản để tránh những sự trừng phạt nội dung sao chép lại không áp dụng
cho trường hợp nội dung lấy trực tiếp từ một website. Vì nếu ai đó đã
copy đoạn text từ một trong những website của tôi và đưa nó lên site
của họ thì đó là nội dung sao chép bị ăn cắp. Còn việc thể hiện bài báo
từ nguồn là trên site của tôi sẽ không cho phép tên trộm tránh khỏi
những sự trừng phạt, ngoại trừ trích dẫn nguồn gốc của nó là từ Reuters
hay AAP.
Tóm lại, sao chép một bài báo từ một nguồn tin tức được
công nhận hay từ một site cho đăng bài viết sẽ không làm các công cụ hỗ
trợ tìm kiếm phải khó chịu miễn sao bài viết đó thể hiện được nguồn gốc
của nó. Không thể làm như vậy có thể dẫn tới site sẽ bị cấm bởi chinh
những công cụ hỗ trợ tìm kiếm, đặc biệt là với sự khắt khe của Google.