Aiuto con Shiftmul (40/100)

Malmo · 17 Ottobre 2024, 9:36pm

Ciao a tutti, stavo provando a risolvere shiftmul ed ero arrivato ad un’idea del genere:
Tra i vari elementi dell’array si formano dei cicli e gli elementi adiacenti dello stesso ciclo saranno alla fine prodotti con K-1 elementi in comune e 1 solo diverso. Un approccio potrebbe essere calcolare solo un valore per ciclo e poi mano a mano calcolare i successivi dividendo per l’elemento che compare tra i fattori del valore già calcolato ma non del valore da calcolare e poi moltiplicando per l’elemento che invece compare solo nei fattori del valore che stiamo calcolando ma non saprei come fare delle divisioni, vista la necessità di utilizzare il modulo. Ero arrivato alla conclusione che, se non sapevo come dividere per un valore, potevo semplicemente evitare di moltiplicare quel valore all’inizio e avevo scritto questo codice:

#include <vector>

using namespace std;

const int MOD=1000000007;
int n, d;

int scorri(int val){
    val-=d;
    if(val<0){
        val+=n*((-1*val/n)+1);
    }
    if(val==n){
        val=0;
    }
    return val;
}

int indietro(int val){
    val+=d;
    val%=n;
    return val;
}

int FastExp(int base, int esponente){
    if(esponente==1){
        return base%MOD;
    }
    long long temp;
    if(esponente%2==0){
        temp=FastExp(base, esponente/2);
        return (temp*temp)%MOD;
    }else{
        temp=FastExp(base, esponente/2);
        return (((temp*temp)%MOD)*base)%MOD;
    }
}

vector<int> execute(int N, int K, int D, vector<int> A){
    if(D==0 || D%N==0){ //Se D==0 o D è multiplo di N, basta elevare ogni elemento di A alla K
        for(int i=0; i<N; i++){
            A[i]=FastExp(A[i], K);
        }
        return A;
    }
    if(K==1){ //se K==1 allora semplicemente B sarà uguale ad A
        return A;
    }
    d=D;
    n=N;
    vector<int> prefixMul(N+1), B(N, -1);
    prefixMul[0]=1;
    int stepFatti, stepRimanenti, index, lastIndex, numCicli, indexFinale;
    long long temp, fattore, tempInd;
    for(int pos=0; pos<N; pos++){
        if(B[pos]==-1){ //Se la posizone attuale non è ancora stata visitata
            index=pos;
            stepFatti=1; //step fatti=1 perché ho già calcolato il primo valore (A[pos])
            stepRimanenti=K-1;
            prefixMul[1]=A[index]%MOD; //aggiorno i prodotti prefissi
            index=scorri(index); //scorro al valore successivo
            while(index!=pos && stepRimanenti>0){ //Scorro l'array finché non si ritorna sul valore iniziale (chiudendo un ciclo) o finché non si sono compiuti K cicli
                stepFatti++;
                stepRimanenti--;
                temp=prefixMul[stepFatti-1]*A[index]; //salvo il prodotto prefisso temporaneamente in un long long per evitare overflow
                temp%=MOD;
                prefixMul[stepFatti]=temp; //aggiorno i prodotti prefissi
                index=scorri(index);
            }
            index=indietro(index);
            indexFinale=index;
            lastIndex=-1;
            //Il ciclo alla linea successiva riempirà gli elementi di B già esplorati nel ciclo precedentecon dei valori temporanei
            while(lastIndex!=pos){ //Scorro l'array al contrario finché non torno al valore dal quale ho iniziato questo secondo ciclo (pos sarà l'ultimo visitato)
                if(lastIndex==-1){ //prima iterazione di questo ciclo
                    B[index]=A[index]%MOD; //assegno il valore a B[index]
                }else{
                    temp=B[lastIndex]*A[index];
                    temp%=MOD;
                    B[index]=temp; //assegno a B[index] un valore pari al prodotto tra B[index appena passato] e A[index]
                }
                lastIndex=index;
                index=indietro(index);
            }
            fattore=1; //fattore sarà un numero che andrà moltiplicato ai vari valori temporanei per ottenere la risposta
            if(stepRimanenti>stepFatti){ //Si possono fare ancora uno o più cicli
                numCicli=stepRimanenti/stepFatti;
                stepRimanenti-=stepFatti*numCicli;
                fattore*=FastExp(B[pos], numCicli); //la base è B[pos] perché il valore di B[pos] è uguale al prodotto di tutti i valori esplorati
            }
            if(stepRimanenti>0){
                fattore*=prefixMul[stepRimanenti]; //se si devono fare degli altri passaggi oltre ai cicli, si va avati moltiplicando per i prodotti prefissi
                fattore%=MOD;
            }
            index=pos;
            lastIndex=-1;
            while(lastIndex!=indexFinale){ //Questo ciclo while continua finché non si è superato l'indice dell'ultimo elemento del ciclo
                //moltiplico B[index] per il fattore
                temp=B[index]*fattore;
                temp%=MOD;
                B[index]=temp;
                //aggiorno index e lastIndex
                lastIndex=index;
                index=scorri(index);
                //aggiorno fattore per il prossimo index
                tempInd=(index-D*(K-1)); //perché il fattore sia corretto per il prossimo index servirà che il fattore venga moltiplicato per l'ultimo valore per cui verrebbe moltiplicato l'index
                if(tempInd<0){
                    tempInd+=N*((-1*tempInd/N)+1);
                }
                if(tempInd==N){
                    tempInd=0;
                }
                fattore*=A[tempInd];
                fattore%=MOD;
            }
        }
    }
    return B;
}

Solo che questo codice funziona solo nella subtask 2 (D=0, che ho gestito separatamente) e in alcuni testcase degli altri subtask (presumo anche loro con D=0).
Qualcuno saprebbe dirmi cosa non funziona?
Grazie

fve5 · 17 Ottobre 2024, 10:37pm

È effettivamente possibile fare le divisioni sotto modulo, in particolare se il tuo modulo p è primo allora:
x/y \equiv xy^{p-2} \pmod p.

Come mai?

Supponiamo che tu voglia calcolare N/x, sapendo che N = kx per qualche k ma avendo il valore di N e di x solo sotto il modulo. Se conoscessi un valore x^{-1} tale che x x^{-1} \equiv 1 \pmod p, allora potresti calcolare Nx^{-1} = kxx^{-1} = k. Dunque moltiplicare per x^{-1} ha lo stesso effetto di dividere per x.

Resta da trovare il valore di x^{-1}, ammesso che esista. Fortunatamente il piccolo teorema di Fermat ci dice che se x \not\equiv 0 \pmod p, allora x^{p-1} \equiv 1 \pmod p. Possiamo riscrivere il primo membro come xx^{p-2} \equiv 1 \pmod p e ora è evidente che x^{p-2} è il valore cercato per x^{-1}. Se x \equiv 0 \pmod p, l’inverso ovviamente non esiste e non si può in nessun modo eseguire la divisione, tuttavia i limiti del problema escludono questo caso.

Questo discorso si può generalizzare per rappresentare anche numeri razionali sotto modulo. In particolare se m \not\equiv 0 \pmod p si pone m/n \equiv mn^{-1} \pmod p e anche questi casi continuano a comportarsi bene sotto somma e prodotto.

Piccolo bonus: prova a capire cosa succede se il modulo non è primo.

Malmo · 18 Ottobre 2024, 4:08pm

Grezie mille della spiegazione! Dopo proverò ad implementarla.

Nel caso specifico di shiftmul se il modulo non fosse primo ci sarebbe la possibilità che il prodotto x tra due o più elementi del vettore A sia un multiplo del modulo p, questo farebbe sì che x\equiv0\pmod p che renderebbe la divisione impossibile da eseguire.
C’era qualcosa di più generico e non necessariamente legato al problema da notare?

fve5 · 18 Ottobre 2024, 6:41pm

Per esempio puoi trovare in generale quali numeri hanno un’inverso moltiplicativo sotto un modulo generico, e anche un algoritmo per calcolare gli inversi per modulo non primo.

Comunque generalmente nei problemi di informatica se serve fare divisioni il modulo è primo.

Volendo shiftmul si può risolvere anche sotto un modulo non primo. Un modo brutto di farlo è usare un segment tree per trovare il prodotto di un range di valori, uno più bello formula il problema in maniera ricorsiva.

Malmo · 19 Ottobre 2024, 4:34pm

Ho provato a implementare la soluzione così:

#include <vector>

using namespace std;

int MOD=1000000007;
int n, d;

int scorri(int val){
    val-=d;
    if(val<0){
        val+=n*((-1*val/n)+1);
    }
    if(val==n){
        val=0;
    }
    return val;
}

int indietro(int val){
    val+=d;
    val%=n;
    return val;
}

int fastExp(int base, int esponente){
    if(esponente==1){
        return base;
    }
    long long temp;
    if(esponente%2==0){
        temp=fastExp(base, esponente/2);
        return (temp*temp)%MOD;
    }else{
        temp=fastExp(base, esponente/2);
        return (((temp*temp)%MOD)*base)%MOD;
    }
}

int inversoModulare(int val){
    return fastExp(val, MOD-2);
}

vector<int> execute(int N, int K, int D, vector<int> A){
    if(D==0 || D%N==0){ //Se D==0 o D è multiplo di N, basta elevare ogni elemento di A alla K
        for(int i=0; i<N; i++){
            A[i]=fastExp(A[i], K);
        }
        return A;
    }
    if(K==1){ //se K==1 allora semplicemente B sarà uguale ad A
        return A;
    }
    n=N;
    d=D;
    long long temp, tempInd;
    int index, stepFatti, stepRimanenti, esponente;
    vector<int> B(N, -1), prefixMul(N+1);
    prefixMul[0]=1;
    vector<bool> visitati(N, false);
    for(int pos=0; pos<N; pos++){
        if(B[pos]==-1){
            stepFatti=0;
            stepRimanenti=K;
            index=pos;
            while(!visitati[index] && stepRimanenti>0){
                visitati[index]=true;
                stepFatti++;
                stepRimanenti--;
                temp=prefixMul[stepFatti-1]*A[index];
                temp%=MOD;
                prefixMul[stepFatti]=temp;
                index=scorri(index);
            }
            temp=prefixMul[stepFatti];
            if(stepRimanenti>stepFatti){
                esponente=stepRimanenti/stepFatti;
                temp*=fastExp(prefixMul[stepFatti], esponente);
                stepRimanenti-=esponente*stepFatti;
            }
            if(stepRimanenti>0){
                temp*=prefixMul[stepRimanenti];
                temp%=MOD;
            }
            B[pos]=temp;
            index=scorri(pos);
            while(B[index]==-1){
                temp=inversoModulare(A[indietro(index)]);
                temp*=B[indietro(index)];
                temp%=MOD;
                tempInd=index-(D*(K-1));
                if(tempInd<0){
                    tempInd+=N*(-1*tempInd/N+1);
                }
                if(tempInd==N){
                    tempInd=0;
                }
                temp*=A[tempInd];
                temp%=MOD;
                B[index]=temp;
                index=scorri(index);
            }
        }
    }
    return B;
}

E comunque mi da 40/100 come a prima, dandomi “Output isn’t correct” nelle subtask 2 e 4, solo che non capisco il perché.

Malmo · 20 Ottobre 2024, 7:47pm

Ho risolto, mi ero scordato di qualche modulo e c’era un overflow qua e là ma l’idea era quella giusta