Po co porównywać całą zawartość, jak można sumy kontrolne, albo jeszcze lepiej - rozmiar plików dokładności do bitów (nie bajtów) i ewent. pierwszą linijkę kodu. Jest niezwykle małe prawdopodobieństwo, żeby były dwa inne pliki z taką samą ilością bitów i takim samym początkiem. Ewentualnie jeśli dwa pliki z taką samą ilością bitów i takim samym początkiem zostaną wykryte zostanie wykonany pełny odczyt pliku.
Przedstawiłem Ci oto ten algorytm. 2/3 roboty wykonane
Wybacz, ale domagasz się od innych zrobienia czegoś za Ciebie i nawet nie raczysz sam sobie przetestować? Może zapłać komuś, to Ci to zrobi, przetestuje i odda gotowca.
Areh - skrypt, skryptem ale jak go wykorzystać, co nalezy edytowac, zmienić a co najważniejsze jak mam dodać 2 pliki do porównania… Mam wpisac jakieś ścieżki czy cuś - w jakim miejscu scryptu? Jak dla mnie za ogólnikowe wytłumaczenie.
SSIS wlaśnie ulatwia życie. Dzien w dzien wykonuje takie operacje (tzn robia sie same po moim ich oprogramowaniu) i jest to naprawde bardzo latwe i fajne narzedzie.
Skoro nie masz pojecia o pisaniu skryptow to zrob to w excelu, Najpierw wyżuć powtóżenia wyświetlając z obu tabel unikalne wartości a potem je porownaj np v_lookup lub wżuć do tabeli przestawnej i niech ona to wyliczy. Poczytaj wczesniej o tabelach przestawnych (chodzi o counta wartosci).
somekind - a co nie ma gotowych programów w internecie, gdzie nie trzeba żadnych skryptów i bez żadnego kombinowania… Na pewno są gotowe programy (jest całe mnóstwo, moż e wobcym języku) ale na pewno są …ale nie jestem w stanie sprawdził tysiące programów nraz …instalować wszystko i testować… Nie szukać na dobreprogramy ale sa inne strony gdzie jest znacznie więcej programów …nawet tych mało znanych… i mniej popularnych albo w wersji płatnej… Jak ktoś zna dobry program to pisać … ale potarzam …sama nazwa nie wystarczy … musi być sprawdzony przez “Ciebie” , ze na pewno działa …
Kwestia jak często musi to wykonywać, jak jednorazowo to oczywiście bez sensu, a jak codziennie to jak najbardziej jest to prawidlowe narzedzie. Ale Manaement studio ma możliwość zaimportowania tabeli z pliku, co tak naprawdę jest paczką SSIS pod spodem ;), co do jednorazowego porownania danych jest jak najbardziej odpowiednie.
“Excel potrafi się zaciąć na pliku kilkadziesiąt MB, a co dopiero 2GB.”
Potafi przetwozyc i pare giga danych, mozna skozystac z powerpivota on wykonuje kompresje danych I takie 2 GB danych tekstowych skurcza sie do pewnie kilkudziesieciu, kilkuset mega w RAM. Do tego wersja 64 bit i możesz bardzo dużo danych przetwarzać.
Czyli nie chce mi sie dajcie mi gotowca. Stary zapomnij.
StawikPiast - Już porównałem - tak jak chciałem na dużym pliku TXT Zainstalowałem najnowszą wersję 2.7.8 64-bit i teraz działa.. może w poprzedniej był jakiś błąd lub bug
a tak na marginesie… Orientujesz się jaki regex używa Edit Pad Lite lub Pro … bo na 100% wpisuje poprawny a pokazuje, że nic nie znaleziono… może program uzywa innej formy regex??
#!/usr/bin/perl
use strict;
use warnings;
my %wynik;
open(my $plik1, "<", "tekst1.txt");
while (<$plik1>) {
chomp;
$wynik{$_}++;
}
close $plik1;
open(my $plik2, "<", "tekst2.txt");
while (<$plik2>) {
chomp;
$wynik{$_}++;
}
close $plik1;
open(my $plik3, ">", "wynik.txt");
foreach my $x ( keys %wynik ) {
if ($wynik{$x} == 1) {
print $plik3 "$x\n";
}
}
close $plik3;
Czy zadziała z gigabajtowymi plikami nie wiem, bo takich nie posiadam. Zmień nazwy “tekst1.txt” i “tekst2.txt” na Twoje pliki. Wynik zapisywany jest do pliku “wynik.txt”.