niestety nie zawsze jest tak kolorowo, mam faktury za wynajem floty samochodów w pdfach, kilka faktur miesięcznie, na każdej z nich koło 60 samochodów. z jednej konkretnej firmy, niby są one ustrykturyzowane, każda faktura wygląda tak samo, nie ma formy tabeli ale jest wszystko ładnie jedno pod drugim. problem w tym, że faktura jest na 2 lub 3 stronach w zależności ile dostawcy się wpisze, i każda strona wczytuje się inaczej, niby można ogarnąć to w query. ale biorę następną fakturę i ona wczytuje się znowu inaczej... i query się sypie. Także z takim frywolnym wczytywaniem z pdfów to bym uważał bo mogą wychodzić kompletne bzdury
Najczęściej w takich przypadkach nie opieramy się na Tabelach z PDFów a na stronach. Łączymy dane z wszystkich kolumn takiej strony a następnie łączymy strony i dalej grzebiemy się jak w pliku tekstowym. W 80-90% przypadków takie podejście jest skuteczne.
@@BillSzysz1 próbowałem, ale i to i to nie było skuteczne. Ostatecznie skończyło się tylko na odczycie pdfa i wrzucenie go na chama do pliku i sformatowanie go formułami w kolumnach obok 😅
@@tomekja3034 Być może Twoje PDFy należą do tych 10-20% których nie mozna obrobić w ten sposób. Często zależy to od mechanizmu (skryptu, kodu) tworzenia PDFa (np generowany jest PDF z jakiegoś sytemu CRM, ERP itd. Nieraz takie PDFy nie spełniają kryteriów/warunków bycia pełnoprawnym PDFem wg ADOBE). Jeszcze jedno - łączenie kolumn z "ciężkich" PDFów robimy za pomocą funkcji Record.ToList i List.Combine żeby uniknąć problemów ze zmienną ilością kolumn z odczytywanego PDFa (plus jeszcze parę tricków by nam null'e nie przeszkadzały). Następna obróbka jest raczej bardzo długa i fragmentaryczna - czyli dotyczy poszczególnych fragnetów PDFa). Zwykle tworzę wtedy wiele funkcji które odpowiadają za poszczególne fragmenty a na koniec łącze to wszystko odpowiednio. Nic z tego nie jest proste i zajmuje sporo czasu choćby ze względu na wstępną analizę PDFa i szukanie sposbów dobrania się do niego.
Świetnie pokazane. Dziękuję bardzo i pozdrawiam serdecznie
@@Jola.W 🙂❤️🥰
Genialne :D Dziękuję 🔥🔥😊😊😁😁👌🏻👌🏻
@@CarlEDO3 bardzo się cieszę 🙂💪❤️
Czy z Outlookiem też można?
@@duniecma podłączamy się do serwera poczty. Klient może być Outlookiem 👍
niestety nie zawsze jest tak kolorowo, mam faktury za wynajem floty samochodów w pdfach, kilka faktur miesięcznie, na każdej z nich koło 60 samochodów. z jednej konkretnej firmy, niby są one ustrykturyzowane, każda faktura wygląda tak samo, nie ma formy tabeli ale jest wszystko ładnie jedno pod drugim. problem w tym, że faktura jest na 2 lub 3 stronach w zależności ile dostawcy się wpisze, i każda strona wczytuje się inaczej, niby można ogarnąć to w query. ale biorę następną fakturę i ona wczytuje się znowu inaczej... i query się sypie.
Także z takim frywolnym wczytywaniem z pdfów to bym uważał bo mogą wychodzić kompletne bzdury
@@tomekja3034 to prawda, niestety wszystko zależy od danych 🥴
Najczęściej w takich przypadkach nie opieramy się na Tabelach z PDFów a na stronach. Łączymy dane z wszystkich kolumn takiej strony a następnie łączymy strony i dalej grzebiemy się jak w pliku tekstowym. W 80-90% przypadków takie podejście jest skuteczne.
@@BillSzysz1 próbowałem, ale i to i to nie było skuteczne. Ostatecznie skończyło się tylko na odczycie pdfa i wrzucenie go na chama do pliku i sformatowanie go formułami w kolumnach obok 😅
@@tomekja3034 Być może Twoje PDFy należą do tych 10-20% których nie mozna obrobić w ten sposób. Często zależy to od mechanizmu (skryptu, kodu) tworzenia PDFa (np generowany jest PDF z jakiegoś sytemu CRM, ERP itd. Nieraz takie PDFy nie spełniają kryteriów/warunków bycia pełnoprawnym PDFem wg ADOBE).
Jeszcze jedno - łączenie kolumn z "ciężkich" PDFów robimy za pomocą funkcji Record.ToList i List.Combine żeby uniknąć problemów ze zmienną ilością kolumn z odczytywanego PDFa (plus jeszcze parę tricków by nam null'e nie przeszkadzały).
Następna obróbka jest raczej bardzo długa i fragmentaryczna - czyli dotyczy poszczególnych fragnetów PDFa). Zwykle tworzę wtedy wiele funkcji które odpowiadają za poszczególne fragmenty a na koniec łącze to wszystko odpowiednio. Nic z tego nie jest proste i zajmuje sporo czasu choćby ze względu na wstępną analizę PDFa i szukanie sposbów dobrania się do niego.