Xu Hướng 7/2024 # Biên Tập Ebook Dạng Epub Từ A # Top 5 Yêu Thích

Định dạng ePub (viết tắt của electronic publication) là một định dạng file chuẩn được dùng cho việc lưu trữ và đọc ebook trên các thiết bị di động phát triển bởi International Digital Publishing Forum. Đây là định dạng được thiết kế sao cho những văn bản

Biên tập ebook dạng epub từ A-Z bằng phần mềm Sigil.

. Hy vọng sẽ giúp ích được cho một số vị chưa có kinh nghiệm. Còn với anh chị em nào đã kinh nghiệm, nếu đọc qua thấy có điểm nào sai sót thì xin vui lòng chỉ dạy thêm

I. GIỚI THIỆU ĐỊNH DẠNG EPUB

Định dạng ePub (viết tắt của electronic publication) là một định dạng file chuẩn được dùng cho việc lưu trữ và đọc ebook trên các thiết bị di động phát triển bởi International Digital Publishing Forum. Đây là định dạng được thiết kế sao cho những văn bản hiển thị trên màn hình có thể được tối ưu hóa cho các thiết bị hiển thị cụ thể được sử dụng bởi người đọc file ePub.

Nói hơi khó hiểu chứ nó giống như khi bạn chỉnh lại kích cỡ cửa sổ hiển thị thì các dòng chữ sẽ được tự động chỉnh lại cho phù hợp với lề phải của trang văn bản, khi hết dòng là tự động xuống dòng mà không “bẻ” (break) cái từ đó ra.

– Hỗ trợ đa dạng: iPad, iPhone, Android, Blackberry, Kindle reader cũng có thể đọc được nếu root máy. – Biên tập trực tiếp trên file epub, rất thuận tiện nếu phải chỉnh sửa lại ebook. Bạn “xào nấu” file .doc trên MS word như nào thì epub trên Sigil cũng vậy. Nếu sử dụng epub trong quá trình số hóa ebook, nhiều người có thể cộng tác sửa chữa lỗi chính tả rất dễ dàng. – Hỗ trợ html 5 và css, nếu muốn bạn có thể thêm hình ảnh, audio, hay video gì cũng được. – Dung lượng file chỉ bằng 50-70% PRC hay mobi

Nhược điểm:

– Hỗ trợ công thức dạng toán học kém, nhưng số lượng ebook mang nội dung này ít, không thì cứ pdf mà chơi. – Khi xem bảng biểu (table)trên điện thoại hay bị vỡ khung, cái này do màn hình đt nhỏ, trên màn hình table không vấn đề gì. Cách khắc phục khả dĩ có lẽ chuyển công thức, table thành ảnh. (Thực ra chuẩn epub 3 mới ra đời có thể giải quyết gần hết các nhược điểm trên nhưng hiện nay ít phần mềm tạo và đọc epub hỗ trợ đầy đủ tiêu chuẩn này.)

II. CÁC PHẦN MỀM CẦN THIẾT

III. BIÊN TẬP EBOOK DẠNG EPUB

Từ menu View của sigil, bạn sẽ thấy có ba chế độ hiển thị là Book View, Code View và Split view. Book View là chế độ hiển thị văn bản tương tự như khi xem trên các trình đọc ebook. Đây là chế độ đơn giản, dễ sử dụng nhất và phù hợp với đa số người dùng. Nội dung văn bản của ebook được lưu với định dạng HTML, do đó chế độ Code View giúp bạn xem và chỉnh sửa chi tiết các mã nguồn này. Tất nhiên bạn cần phải có kiến thức về các thẻ HTML để sử dụng được chế độ này. Cuối cùng chế độ Split View sẽ chia đôi màn hình để hiển thị cả nội dung và mã nguồn cùng lúc.

– Mở sigil, Chọn File – New sẽ có Section đầu tiên. copy chương 1 từ nguồn text vào đây. Việc chia ebook thành các file html khác nhau sẽ giúp quản lý nội dung nhẹ nhàng hơn, thông thường mỗi chương thành 1 file html là đẹp nhất.

– Biên tập văn bản: trên menu bạn có các thao tác với văn bản: in đậm, in nghiêng, căn lề đoạn văn, bulist…

3. Tạo siêu liên kết:

Xem bài viết của bạn Tamchec ở phía dưới

Nhưng mình hay thêm bằng calibre tiện và trực quan hơn

6. Định dạng hiển thị văn bản bằng CSS

– CSS là viết tắt của cụm từ “Cascading Style Sheet”, đây là một ngôn ngữ quy định cách trình bày của các thẻ html. Ta sẽ thể tận dụng css để hiển thị các đối tượng văn bản, hình ảnh trong ebook theo một quy luật định sẵn. Nhưng ở đây mình sẽ minh họa cách dùng css đơn giản thôi.

– Nhấp phải chuột vào mục Styles (Book Browser bên trái giao diện sigil) chọn Add Blank Stylesheet. Bạn tạo được một file css mới: chúng tôi Bạn dán đoạn code sau vào nội dung file css:

p {text-indent: 1.2em; margin-left:0; margin-right:0; margin-top:0; margin-bottom:0; text-align: justify; } img { display: block; margin: 0 auto; text-align: center; }

Đoạn mã trong mục p { }có tác dụng tự động thụt từ đầu dòng, dàn đều chữ trong paragraph, khoảng cách với lề. Đoạn mã img {} làm ảnh tự động căn giữa. Tham khảo về css tại http://www.w3schools.com/css

Việc dùng css là khá khó nếu không biết chút ít kiến thức lập trình web. Khi tạo ebook bằng sigil bạn có thể bỏ qua phần này và chuyển đổi ebook một lần nữa bằng calibre (định dạng ban đầu và chuyển đổi đều là epub. Phần mềm calibre sẽ tự động gán css và định dạng ebook tự động.

Calibre là một ứng dụng quản lý thư viện e-book mã nguồn mở và miễn phí được phát triển bởi những lập trình viên trót làm con mọt sách. Nó có rất nhiều tính năng và được chia thành các phần chính sau:

Quản lý thư viện.

Chuyển đổi định dạng E-book.

Đồng bộ với các thiết bị đọc e-book.

Tải tin tức từ các trang web và chuyển đổi nó thành dạng e-book.

Đọc các tập tin e-book.

Máy chủ quản lý nội dung để truy cập trực tuyến vào bộ sưu tập sách của bạn.

Biên tập E-book theo các định dạng e-book chính.

Hướng dẫn tạo liên kết và chú thích (links and footnotes)

– Các bạn có thể xem hướng dẫn bằng tiếng Anh ở đây.

Đây là phần khá quan trọng trong ebook, nếu chú thích đặt ở cuối sách mà không có links thì sẽ rất khó tra, còn nếu để chú thích ở giữa thì đọc khá ức chế mà làm mất tính “thẩm mỹ” của ebook.

Tips: – Nếu sách có ít chú thích thì có thể tạo 1 file xhtml riêng để chứa phần chú thích, nếu sách gồm nhiều chương và nhiều chú thích thì phần chú thích nên nằm ở cuối mỗi chương. – Nên đặt tên ids theo chương và thứ tự của note để không bị loạn.

Đây là file mình dùng làm ví dụ, các bạn có thể tải về xem thử: https://drive.google.com/file/d/0B2rMWBn_jQ3IY3JvQjlpV2dpbTA/edit?usp=sharing

Bước 3: Sau khi đã cop xong, bạn mở lại phần cấu hình từ điển theo hướng dẫn ở bước 2, chọn file từ điển là Vietnamese.dic

Nhớ đảm bảo ô “Highlight Misspelled Words” được chọn.

Đến đây là xong phần cấu hình.

Hướng dẫn nối các đoạn bị ngắt sai do dùng phần mềm nhận dạng

Nguyên nhân: Do 1 đoạn nằm ở 2 trang khác nhau, phần mềm nhận dạng sẽ tự ngắt thành 2 đoạn.

Đặc điểm: – Ký tự cuối cùng của đoạn đầu thường không có dấu kết thúc (1) – Ký tự đầu tiên của đoạn sau thường không phải chữ viết hoa (2)

Cách xử lý: Sử dụng regex tìm những chỗ có đặc điểm trên để nối lại

Bước 2: Do tiếng Việt có một số ký tự không nằm trong bảng chữ cái tiếng Anh nên bước 1 sẽ vẫn còn thiếu (ví dụ ở hình dưới). Sử dụng đặc điểm 2 để tìm và nối. Ở ô search để: “

([a-z])” (giữa

là đoạn xuống dòng, cần copy và paste ở sigil) Ô replace để: ” 1″

Điều làm mình bất tiện nhất khi dùng Sigil đó là làm chú thích. Đặc biệt là khi làm xong xuôi rồi mới phát hiện bị thiếu hoặc thừa chú thích nào đó. Việc thêm hay bớt thủ công sẽ rất mất thời gian. Plugin “Incremental IDs” sẽ giúp làm việc này một cách tự động. Bài viết sẽ hướng dẫn cách cài đặt plugin Incremental IDs cho Sigil.

Thực hiện: (Bổ sung 3/6/2024 : Sigil hiện tại đã nhúng sẵn python buldle, nê nkhông cần làm Bước 1 nữa)

5.1. Cài thư viện beautifulsoup4 cho python. – Mở cmd của windows dưới quyền admin. – Di chuyển đến thư mục Scripts của Python (thường là C:Python27Scripts)

– Cài đặt beautifulsoup4

pip install beautifulsoup4

Việc cài đặt vậy là xong rồi đó.

Sử dụng: Giả sử trong nội dung có chứa các phần cần chú thích:

Sau khi chạy xong sẽ được:

Chu thich n

rồi chạy lại plugin.

Giả sử tiêu đề sách có dạng:

Chương 1

Trên đường về, bao nhiêu tiếc hận,

Đêm rừng thông, nhớ lại tình xưa.

Muốn làm Chương 1 (2, 3… hoặc dạng text như: một – thứ nhất, hai – thứ hai… ) thành heading 1 hai câu thơ dưới thành heading 2 thì dùng lệnh: Find:

Replace:

Kết quả:

Chương 1

Trên đường về, bao nhiêu tiếc hận,

Đêm rừng thông, nhớ lại tình xưa.

7. Dùng sigil chia file html thành nhiều file nhỏ.

Giả sử bạn muốn chia ở vị trí đầu tag h1. Thì ở chế độ normal ô Find nhập:

Sau đó chỉ việc bấm F6 hoặc vào Edit/Split At Markers là file html đó sẽ được ngắt ra làm nhiều file nhỏ trước các h1.

Trường hợp bạn muốn ngắt ở trước một vị trí xác định nào đó thì có thể dùng chế độ Regex để chèn

Lưu ý: khi chia thế này sẽ sinh ra 1 file html trắng ở đầu h1 thứ nhất, nên cần xóa đi sau khi chia xong.

8. Dùng Sigil và MS Word để gom chú thích

1. Liên kết các file html chứa nội dung lại thành 1 file.

2. Tạo 1 file htmt trắng ở cuối.

3. Ở file chứa nội dung đọc bằng chế độ Code View, rồi ở chế độ Regex

[(d+)] (.*?)

Ô Replace nhập: [1] 2 Bấm Relace All, rồi cắt toàn bộ nội dung (ở chế độ Code View) sang một file Word trắng mở sẵn.

Trong Word mở lệnh Find (Ctrl+H), chọn chế độ Use wildcards

Ô Find nhập: ??

Rồi chọn Find/Find In/Main Document là tất cả những nội dung nằm trong các thẻ … sẽ được chọn. Cắt (Ctrl+X) tất cả rồi dán vào giữa cặp … của file html trắng nói trên.

Copy hoặc cut phần còn lại ở file word trở lại file html chứa nội dung.

Trong file chứa nội dung chú thích này, ở chế độ Regex

Ô Find nhập: (.*?)

Ô Replace nhập:

1

Bấm Replace All là xong.

Để làm cho chỉ số chú thích ở nội dung và ở file chứa chú thích theo thứ tự từ đầu đến cuối (đánh lại chỉ số chú thích) và tạo link thì ở các post trước cũng đã đề cập nên tôi không trình bày lại ở đây.

Note: (*) Thực tế mặc định không có cặp thẻ …

Sigil Guide 1: Tạo, gõ ebook. Chỉnh qua văn bản với CSS

Dành cho các bạn nào chưa biết gì về tạo ebook, nhưng biết download và cài đặt chương trình, biết gõ và chỉnh sửa văn bản.

Công cụ cần là Sigil (free)

Sigil Guide 2: Ứng dụng CSS để tô điểm các đoạn văn khác nhau.

Sigil Guide 4 Thêm ảnh bìa, Sửa thông tin: