กลับไปที่เครื่องมือ

แยกรูปภาพจาก PDF

แยกรูปภาพที่ฝังอยู่จากไฟล์ PDF

แยกรูปภาพราสเตอร์ที่ฝังอยู่โดยตรงจาก PDF
วางไฟล์ PDF ที่นี่หรือคลิกเพื่อเลือกไฟล์
เลือกไฟล์ PDF เพื่อแยกรูปภาพ

วิธีดึงรูปภาพออกจาก PDF

หากต้องการดึงรูปภาพออกจาก PDF ให้อัปโหลดไฟล์แล้วดาวน์โหลดรูปภาพที่ฝังอยู่เป็นไฟล์รูปภาพแยกชิ้น หรือเป็นไฟล์ ZIP ก็ได้ครับ เครื่องมือนี้อ่านข้อมูลรูปภาพโดยตรงจากโครงสร้างภายในของเอกสาร โดยคงความละเอียดและรูปแบบดั้งเดิมของแต่ละรูปไว้ครบถ้วน ไม่ต้องติดตั้งซอฟต์แวร์หรือสมัครบัญชีใดๆ ทั้งนั้นครับ

การดึงรูปภาพจาก PDF ทำงานอย่างไร

รูปภาพใน PDF ถูกเก็บเป็น XObject stream object ไว้ใน resource dictionary ของเอกสารครับ แต่ละ image stream จะถูก encode ด้วย filter เฉพาะที่กำหนดรูปแบบการบีบอัด ได้แก่ DCTDecode สำหรับรูปภาพ JPEG, FlateDecode สำหรับข้อมูล PNG และ bitmap ที่บีบอัดแล้ว และ JPXDecode สำหรับ JPEG 2000 ตัว extractor จะอ่าน stream object เหล่านี้โดยตรงจากโครงสร้างเอกสาร โดยไม่ต้อง render หน้าใดๆ เลย นี่คือเหตุผลที่ผลลัพธ์ที่ได้จะคงความละเอียด ความลึกของสี และการบีบอัดดั้งเดิมของแต่ละรูปไว้ แทนที่จะเป็นแค่ screenshot ของหน้าเอกสารครับ

รูปแบบไฟล์ผลลัพธ์ของแต่ละรูปที่ดึงออกมาจะเป็นไปตาม encoding ดั้งเดิมของมัน รูปภาพที่เก็บเป็น DCTDecode stream จะได้รับกลับมาเป็นไฟล์ JPEG ส่วนรูปภาพที่เก็บเป็นข้อมูล FlateDecode จะได้รับกลับมาเป็น PNG ซึ่งหมายความว่าคุณจะได้ไฟล์ asset ต้นฉบับที่ฝังไว้จริงๆ โดยไม่มีการ re-encode หรือสูญเสียคุณภาพใดๆ ทั้งสิ้นครับ

รูปภาพที่ฝังอยู่ vs. การ Render หน้าเอกสาร - ควรใช้เครื่องมือไหนดี

การดึงรูปภาพที่ฝังอยู่และการแปลงหน้าเอกสารเป็นรูปภาพเป็นการดำเนินการที่แตกต่างกันสองอย่างครับ เครื่องมือนี้ดึงรูปภาพที่เก็บเป็น object แยกชิ้นภายใน PDF เช่น รูปถ่าย โลโก้ กราฟ และภาพประกอบ แต่ถ้าต้องการแปลงทั้งหน้า PDF เป็นไฟล์รูปภาพโดยไม่สนใจเนื้อหา ให้ใช้ ตัวแปลง PDF เป็น JPG หรือ เครื่องมือแปลง PDF เป็น PNG ซึ่งจะ render แต่ละหน้าเป็น raster image ครับ

PDF ที่สแกนมาเป็นกรณีพิเศษครับ เอกสารที่สแกนจะเก็บทั้งหน้าเป็น raster image object ชิ้นเดียว แทนที่จะมีรูปภาพแยกชิ้นฝังอยู่ภายใน ในกรณีนี้ เครื่องมือจะคืนรูปภาพหนึ่งรูปต่อหนึ่งหน้าที่สแกน ซึ่งก็คือภาพสแกนเต็มหน้าที่ความละเอียดดั้งเดิมนั่นเองครับ

วิธีดึงรูปภาพจาก PDF โดยใช้ PDFDeal

  1. อัปโหลดไฟล์ของคุณ คลิกปุ่มอัปโหลด หรือลากเอกสารมาวางในพื้นที่ของเครื่องมือได้เลยครับ
  2. ระบุหน้าที่ต้องการ (ถ้าจำเป็น) ถ้าต้องการรูปภาพจากบางหน้าเท่านั้น ให้ป้อนช่วงหน้าก่อนประมวลผลครับ
  3. ประมวลผลเอกสาร เครื่องมือจะสแกน resource dictionary ของเอกสารและตรวจหา image stream ที่ฝังอยู่ทั้งหมดโดยอัตโนมัติครับ
  4. ดาวน์โหลดรูปภาพของคุณ บันทึกเป็นไฟล์แยกชิ้น หรือดาวน์โหลดรูปภาพที่ดึงออกมาทั้งหมดในไฟล์ ZIP เดียวได้เลยครับ

ควรใช้ Image Extractor เมื่อไหร่

  • กู้คืนงานศิลปะต้นฉบับหรือรูปถ่ายสินค้าจาก PDF ที่ finalize แล้ว เมื่อไม่มีไฟล์ต้นฉบับอีกแล้ว
  • ดึงกราฟหรือไดอะแกรมจากรายงานเพื่อนำไปใช้ในการนำเสนองาน
  • เก็บถาวรรูปถ่ายที่สแกนจากเอกสารดิจิทัลด้วยความละเอียดเต็มรูปแบบ
  • ดึงโลโก้หรือภาพประกอบจากสัญญาหรือโบรชัวร์เพื่องานออกแบบ
  • นำรูปภาพจากงานวิจัยที่ตีพิมพ์แล้วหรือเอกสารทางเทคนิคกลับมาใช้ใหม่

สำหรับเอกสารที่ต้องการนำเนื้อหาข้อความไปใช้ด้วย ตัวแปลง PDF เป็น Word จัดการการดึงข้อความและ layout ได้ในขั้นตอนเดียวครับ ส่วนถ้าต้องการทำตรงกันข้ามและรวมรูปภาพเข้าเป็น PDF ให้ใช้ เครื่องมือแปลงรูปภาพเป็น PDF ครับ

ดูวิธีการทำงาน

คำถามที่พบบ่อย

อัปโหลด PDF ของคุณไปยัง image extractor ของ PDFDeal ครับ เครื่องมือจะสแกน resource dictionary ของเอกสารเพื่อหา image stream ที่ฝังอยู่ และคืนแต่ละรูปเป็นไฟล์แยกชิ้น ดาวน์โหลดรูปภาพทีละไฟล์ หรือดาวน์โหลดทั้งหมดเป็นไฟล์ ZIP ได้เลยครับ ไม่ต้องสมัครบัญชีหรือติดตั้งซอฟต์แวร์ใดๆ ทั้งนั้น

ไม่ครับ ตัว extractor อ่าน image stream โดยตรงจากโครงสร้างเอกสารโดยไม่มีการ re-encode ใดๆ รูปภาพ JPEG ที่เก็บอยู่ใน PDF จะถูกคืนกลับมาเป็น JPEG data เดิมที่ฝังไว้ตั้งแต่แรก ไม่มีขั้นตอน screenshot หรือ re-rendering เลย จึงไม่มีการสูญเสียคุณภาพแต่อย่างใด ความละเอียดและความลึกของสีของผลลัพธ์จะตรงกับ asset ที่ฝังไว้ดั้งเดิมทุกประการครับ

รูปแบบไฟล์ผลลัพธ์ของแต่ละรูปขึ้นอยู่กับวิธีที่มันถูกเก็บไว้ใน PDF ครับ รูปภาพที่ encode ด้วยการบีบอัดแบบ DCTDecode จะได้รับกลับมาเป็นไฟล์ JPEG ส่วนรูปภาพที่ encode ด้วย FlateDecode จะได้รับกลับมาเป็น PNG รูปแบบไฟล์จะเป็นไปตาม encoding ดั้งเดิม ดังนั้นคุณจะได้รับแต่ละ asset ในรูปแบบการบีบอัดดั้งเดิมของมัน โดยไม่มีการแปลงรูปแบบใดๆ ครับ

การดึงรูปภาพจะดึง graphic object แต่ละชิ้นที่เก็บอยู่ในโครงสร้างของเอกสาร เช่น รูปถ่าย โลโก้ และภาพประกอบครับ ส่วนการแปลงหน้าเป็นรูปภาพจะ render ทั้งหน้า รวมถึงข้อความ รูปทรง และพื้นหลัง เป็นไฟล์ raster ไฟล์เดียว ใช้การดึงรูปภาพเมื่อต้องการ asset ที่ฝังไว้ดั้งเดิม และใช้ เครื่องมือแปลง PDF เป็น JPG เมื่อต้องการภาพแสดงผล layout ทั้งหน้าครับ

ได้ครับ แต่ PDF ที่สแกนมาทำงานต่างจากเอกสารที่มีรูปภาพฝังอยู่ครับ PDF ที่สแกนจะเก็บแต่ละหน้าเป็น raster image object เต็มหน้าชิ้นเดียว แทนที่จะมีรูปภาพแยกชิ้นอยู่ภายใน ตัว extractor จะคืนรูปภาพหนึ่งรูปต่อหนึ่งหน้าที่สแกน ซึ่งก็คือภาพสแกนทั้งหน้าที่ความละเอียดดั้งเดิมครับ ถ้าต้องการดึงข้อความจากเอกสารที่สแกนมา เครื่องมือ OCR สามารถรู้จำและดึง text layer ออกมาได้ครับ

ได้ครับ ก่อนประมวลผล ให้ป้อนช่วงหน้าในช่องหน้าเพื่อจำกัดการดึงรูปภาพเฉพาะหน้าที่ต้องการ ตัวอย่างเช่น การป้อน 2-5 จะดึงเฉพาะรูปภาพที่ฝังอยู่ในหน้า 2 ถึง 5 เท่านั้น ฟีเจอร์นี้มีประโยชน์มากสำหรับเอกสารขนาดใหญ่ที่ต้องการเฉพาะ asset จากบางส่วนครับ

ถ้าไม่พบรูปภาพ เป็นไปได้ว่าเอกสารนั้นไม่มี XObject image stream ที่ฝังอยู่เลยครับ สิ่งนี้เกิดขึ้นเมื่อ element ที่มองเห็นได้ถูกวาดโดยใช้คำสั่ง vector graphics แทนที่จะเป็น raster image เช่น รูปทรง เส้น และกราฟที่สร้างโดยตรงใน PDF element แบบ vector ไม่ใช่ image object และไม่สามารถดึงออกมาเป็นไฟล์รูปภาพได้ครับ ถ้า PDF มีหน้าที่สแกนมาและไม่มีผลลัพธ์ใดๆ ให้ลองดึงโดยไม่ใช้ตัวกรองช่วงหน้า เพื่อให้แน่ใจว่าทุกหน้าถูกรวมอยู่ในการสแกนครับ

ไฟล์จะถูกอัปโหลดผ่าน HTTPS และประมวลผลบนเซิร์ฟเวอร์ของ PDFDeal ครับ ไฟล์ชั่วคราวจะถูกลบโดยอัตโนมัติเมื่อการดึงรูปภาพเสร็จสิ้นและส่งผลลัพธ์กลับมาแล้ว เอกสารที่อัปโหลดจะไม่ถูกเก็บไว้ ไม่ถูกแชร์กับบุคคลที่สาม และไม่ถูกนำไปใช้เพื่อวัตถุประสงค์ใดๆ นอกจากการดำเนินการที่ร้องขอครับ

ได้ครับ แต่ต้องใช้เครื่องมือ render หน้าเอกสารแทน image extractor ตัวแปลง PDF เป็นรูปภาพ จะ render ทุกหน้าของ PDF เป็นไฟล์ JPEG หรือ PNG คุณภาพสูง วิธีนี้เหมาะสมเมื่อต้องการภาพ snapshot ของ layout ทั้งหน้า แทนที่จะเป็นรูปภาพแต่ละชิ้นที่ฝังอยู่ครับ

ได้ครับ หากต้องการรวมรูปภาพเข้าเป็นเอกสาร PDF ใหม่ ให้ใช้ เครื่องมือแปลงรูปภาพเป็น PDF อัปโหลดไฟล์รูปภาพ จัดเรียงตามลำดับที่ต้องการ แล้วดาวน์โหลด PDF ที่ได้ครับ ส่วนถ้าต้องการแทรกรูปภาพลงใน PDF ที่มีอยู่แล้วในตำแหน่งที่กำหนด PDF editor ให้คุณวางและปรับขนาดรูปภาพบนหน้าใดก็ได้ครับ

Adobe Acrobat Pro มีฟีเจอร์ export ที่สามารถดึงรูปภาพที่ฝังอยู่จาก PDF ได้ครับ โดยอยู่ที่เมนู Tools จากนั้น Export PDF แล้วเลือก Image อย่างไรก็ตาม ต้องใช้ subscription ของ Acrobat Pro ครับ ส่วน extractor ของ PDFDeal ทำการดำเนินการเดียวกันได้โดยไม่ต้องสมัคร subscription หรือติดตั้งซอฟต์แวร์ใดๆ ใช้งานได้เลยผ่านเบราว์เซอร์โดยตรงครับ